分页: 1 / 1

[问题]怎样把html转换成txt文本

发表于 : 2008-05-31 18:23
juise
有很多个html,怎样把内容(主要是中文)提取出来存成文本文件,去掉网页的格式和代码?
希望有个shell脚本来实现。
谢谢! :D

发表于 : 2008-05-31 19:41
dbzhang800
html转换成txt文本 的现成的程序应该不少吧

发表于 : 2008-05-31 19:42
aBiNg
html2text

发表于 : 2008-05-31 19:47
millenniumdark

代码: 全选

sed -e 's/<[^>]*>//g'

Re: [问题]怎样把html转换成txt文本

发表于 : 2008-11-05 20:09
lumjstu
w3m -dump

Re: [问题]怎样把html转换成txt文本

发表于 : 2008-11-05 20:55
xiooli
lumjstu 写了:w3m -dump
这个正 :em11