正则表达式去掉文本中的特定文字
发表于 : 2018-02-12 15:55
比如小说中包含这样几个字," ubuntu中文论坛",而且还随机的在其中夹杂了干扰字符,加大了去掉它的难度.
用正则表达式替换它们:[ubnt中文论坛023456789]{10,21}
这里数字0~9代表插入的干扰字,要找的广告就是这些字符的排列组合;
这个广告是10个字到20个长度:10个字的是未插入字符,20个代表每个字后都插了一个,21最前面也插入一个干扰字.
试试看吧
用正则表达式替换它们:[ubnt中文论坛023456789]{10,21}
这里数字0~9代表插入的干扰字,要找的广告就是这些字符的排列组合;
这个广告是10个字到20个长度:10个字的是未插入字符,20个代表每个字后都插了一个,21最前面也插入一个干扰字.
试试看吧