我想求两个脚本,脚本都是关于分析网页内容的
发表于 : 2010-12-21 23:28
第一个脚本:
功能是下载网页内含有图片的链接,分析后,用wget或curl等下载图片的原始链接。
第二个脚本:
功能是分析一些社区或者网站以及博客的更新内容,然后抓取文章的主体,再把文章的主体导出到本地,每个文件文件名以文章的题目命名。或者是以随机数命名。
我没学过啥语言,所以不知道要怎么分析网页内容。
希望各位高手能帮忙,这样会提高我的阅读速度,而不是一个一个网页的翻阅,就像RSS的效果一样,可以订阅,如果改善一些用户体验就更好了,比如支持用户输入要订阅的网址。
功能是下载网页内含有图片的链接,分析后,用wget或curl等下载图片的原始链接。
第二个脚本:
功能是分析一些社区或者网站以及博客的更新内容,然后抓取文章的主体,再把文章的主体导出到本地,每个文件文件名以文章的题目命名。或者是以随机数命名。
我没学过啥语言,所以不知道要怎么分析网页内容。
希望各位高手能帮忙,这样会提高我的阅读速度,而不是一个一个网页的翻阅,就像RSS的效果一样,可以订阅,如果改善一些用户体验就更好了,比如支持用户输入要订阅的网址。