过滤正则表达式,只保留中文、英文、数字及一些标点符号.
str = "123,456" # 要过滤的字符串 re_exp = u"([^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a\’!\"#$%&\'()*+,-./:;<=>?@,。?、…【】《》?“”‘’!["u"\\]^_`{|}~\s])" # 过滤正则表达式,只保留中文、英文、数字及一些标点符号 re_exp_2 = u"([.*\[d+].*])" # 过滤形如[1]等的引用 result_str = re.sub(re_exp, "", str) print(result_str)