分页: 1 / 1

如何去除中文的标点符号?

发表于 : 2009-08-08 15:37
zglcx123

cat abc.txt | tr "," " "
或者
cat abc.txt | sed 's/[;:,。?()]//g'
这两种方式都不行呀,
上面2种方式可以删除英文的符号,,但中文的不行呀

Re: 如何去除中文的标点符号?

发表于 : 2009-08-08 15:45
soiamso
是utf-8编码吗?

Re: 如何去除中文的标点符号?

发表于 : 2009-08-08 19:08
zglcx123
自己搞定了!
先把全部中文字符替换成英文的,再一起删除

sed 's/[;:,。()?]/,/g' > data

cat data | sed 's/[;:,.()?]/ /g' > data2

这样就可以了