第一个脚本:
功能是下载网页内含有图片的链接,分析后,用wget或curl等下载图片的原始链接。
第二个脚本:
功能是分析一些社区或者网站以及博客的更新内容,然后抓取文章的主体,再把文章的主体导出到本地,每个文件文件名以文章的题目命名。或者是以随机数命名。
我没学过啥语言,所以不知道要怎么分析网页内容。
希望各位高手能帮忙,这样会提高我的阅读速度,而不是一个一个网页的翻阅,就像RSS的效果一样,可以订阅,如果改善一些用户体验就更好了,比如支持用户输入要订阅的网址。
我想求两个脚本,脚本都是关于分析网页内容的
- numbchild
- 帖子: 107
- 注册时间: 2010-03-16 12:34
- fanhe
- 帖子: 2357
- 注册时间: 2007-03-24 23:45
Re: 我想求两个脚本,脚本都是关于分析网页内容的
我也不输网络方面的东西
大概是w3m dump下来然后分析源码吧……
大概是w3m dump下来然后分析源码吧……