Firefox 可以保存单个网页,但是,当有一大堆互相链接的网页时, Firefox 就力不从心了,它可以保存,但是在浏览这些网页时点击链接却有会被带到 Internet 上。
利用 wget -p -k 可以把整个网站保存,并且把链接转换成本地的相对链接。
但是 wget 要一个个输入网址的话,非累死不可,于是我用 PyQt4 写了这个 GUI 前端,通过简单的通配符(*),自动生成带数字的 URL 列表(想想分页的文章,往往是 http://domin.com/page_03.htm),调用 wget 保存网站,在很短的时间内做出来的,目前功能比较简单,以后有空再完善。
Licensed under GNU GPLv3
Known bugs:
1. 终端输出不能格式化
4. Wget 会遵循 robots.txt, 导致部分网站无法下载。(这个功能竟然不能在 wget 里关掉)
Fixed bugs:
2. 没有输入任何 URL 时若点击 Start Download 会导致界面被禁用。 (Fixed in 0.0.2)
3. Remove 按钮未实现。 (Fixed in 0.0.2)
下载:
展开直接运行 WebArchiver.py, 需要安装 python-qt4 运行环境。
例子:
要下载 http://abc.com/somepage.html, http://abc.com/somepage_2.html, ..., http://abc.com/somepage_11.html
则设置模板为, http://abc.com/somepage_*.html, 通配符长度为 1, 起始为 2, 结束为 11. 即可添加 2 到 11 页。然后在添加 http://abc.com/somepage.html,点击 Start Download 即可调用 Wget 下载。
WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
-
- 帖子: 598
- 注册时间: 2009-09-19 20:50
WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
上次由 Bill Lee 在 2011-06-04 10:07,总共编辑 1 次。
aMule 2.3.1 is coming...
真正动态的 amule-dlp is coming...
本人帐号在2011年1月被盗,在2011年1月3日17:19到2010年1月6日13:34之间本帐号发的一切帖子、短信等与本人无关!
amule-dlp 开发动态
amule-dlp on Google Code
WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
Linux 2.6.34 编译笔记
真正动态的 amule-dlp is coming...
本人帐号在2011年1月被盗,在2011年1月3日17:19到2010年1月6日13:34之间本帐号发的一切帖子、短信等与本人无关!
amule-dlp 开发动态
amule-dlp on Google Code
WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
Linux 2.6.34 编译笔记
- 枫叶饭团
- 帖子: 14683
- 注册时间: 2010-06-16 1:05
- 系统: Mac OS X
- 来自: Tencent
- 联系:
-
- 帖子: 598
- 注册时间: 2009-09-19 20:50
Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
修复了一个很严重的错误 (bug 3)
图片没更新
图片没更新
aMule 2.3.1 is coming...
真正动态的 amule-dlp is coming...
本人帐号在2011年1月被盗,在2011年1月3日17:19到2010年1月6日13:34之间本帐号发的一切帖子、短信等与本人无关!
amule-dlp 开发动态
amule-dlp on Google Code
WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
Linux 2.6.34 编译笔记
真正动态的 amule-dlp is coming...
本人帐号在2011年1月被盗,在2011年1月3日17:19到2010年1月6日13:34之间本帐号发的一切帖子、短信等与本人无关!
amule-dlp 开发动态
amule-dlp on Google Code
WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
Linux 2.6.34 编译笔记
-
- 帖子: 3
- 注册时间: 2009-10-18 15:53
Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端
收藏了
收藏了
- fuhaoyun
- 帖子: 526
- 注册时间: 2009-05-08 14:12
- 来自: http://weibo.com/u/2201287863
Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
这么好的东西,还在还在开发么
只用Ubuntu/Unity:安全、高效、自由、简洁!
http://weibo.com/u/2201287863
----------------------------------------------------
用了4年Ubuntu,发现离开windows也可以活得很好
看球赛、炒股、聊天、office等等都不算问题了
一切都是习惯,困难解决了就好