比如小说中包含这样几个字," ubuntu中文论坛",而且还随机的在其中夹杂了干扰字符,加大了去掉它的难度.
用正则表达式替换它们:[ubnt中文论坛023456789]{10,21}
这里数字0~9代表插入的干扰字,要找的广告就是这些字符的排列组合;
这个广告是10个字到20个长度:10个字的是未插入字符,20个代表每个字后都插了一个,21最前面也插入一个干扰字.
试试看吧
正则表达式去掉文本中的特定文字
- 冲浪板
- 论坛版主
- 帖子: 7513
- 注册时间: 2007-05-06 8:19
- comero
- 帖子: 21
- 注册时间: 2016-09-15 9:30
- 来自: 浙江省杭州市
Re: 正则表达式去掉文本中的特定文字
直接写出这几个字,只要在中间插几个 `[干扰字符]?`就好了啊