正则表达式去掉文本中的特定文字

sh/bash/dash/ksh/zsh等Shell脚本
回复
头像
冲浪板
论坛版主
帖子: 7513
注册时间: 2007-05-06 8:19

正则表达式去掉文本中的特定文字

#1

帖子 冲浪板 » 2018-02-12 15:55

比如小说中包含这样几个字," ubuntu中文论坛",而且还随机的在其中夹杂了干扰字符,加大了去掉它的难度.
用正则表达式替换它们:[ubnt中文论坛023456789]{10,21}
这里数字0~9代表插入的干扰字,要找的广告就是这些字符的排列组合;
这个广告是10个字到20个长度:10个字的是未插入字符,20个代表每个字后都插了一个,21最前面也插入一个干扰字.

试试看吧
头像
comero
帖子: 21
注册时间: 2016-09-15 9:30
来自: 浙江省杭州市

Re: 正则表达式去掉文本中的特定文字

#2

帖子 comero » 2018-02-12 17:08

直接写出这几个字,只要在中间插几个 `[干扰字符]?`就好了啊
回复