如何去除中文的标点符号?

sh/bash/dash/ksh/zsh等Shell脚本
回复
头像
zglcx123
帖子: 110
注册时间: 2007-08-20 16:34
来自: Earth

如何去除中文的标点符号?

#1

帖子 zglcx123 » 2009-08-08 15:37


cat abc.txt | tr "," " "
或者
cat abc.txt | sed 's/[;:,。?()]//g'
这两种方式都不行呀,
上面2种方式可以删除英文的符号,,但中文的不行呀
Dropbox!点我注册,你的起点高了500M,我也能多得到500M,共赢!
--------
HP V3808TU (2008.03.08---2012.10.08)
ASUS N56VZ (2012.10.08---未来)
soiamso
帖子: 418
注册时间: 2008-09-06 2:00

Re: 如何去除中文的标点符号?

#2

帖子 soiamso » 2009-08-08 15:45

是utf-8编码吗?
头像
zglcx123
帖子: 110
注册时间: 2007-08-20 16:34
来自: Earth

Re: 如何去除中文的标点符号?

#3

帖子 zglcx123 » 2009-08-08 19:08

自己搞定了!
先把全部中文字符替换成英文的,再一起删除

sed 's/[;:,。()?]/,/g' > data

cat data | sed 's/[;:,.()?]/ /g' > data2

这样就可以了
Dropbox!点我注册,你的起点高了500M,我也能多得到500M,共赢!
--------
HP V3808TU (2008.03.08---2012.10.08)
ASUS N56VZ (2012.10.08---未来)
回复