分页: 1 / 1

WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)

发表于 : 2011-06-01 18:23
Bill Lee
Firefox 可以保存单个网页,但是,当有一大堆互相链接的网页时, Firefox 就力不从心了,它可以保存,但是在浏览这些网页时点击链接却有会被带到 Internet 上。
利用 wget -p -k 可以把整个网站保存,并且把链接转换成本地的相对链接。
但是 wget 要一个个输入网址的话,非累死不可,于是我用 PyQt4 写了这个 GUI 前端,通过简单的通配符(*),自动生成带数字的 URL 列表(想想分页的文章,往往是 http://domin.com/page_03.htm),调用 wget 保存网站,在很短的时间内做出来的,目前功能比较简单,以后有空再完善。
Licensed under GNU GPLv3
Screenshot-WebArchiver.png
WebArchiver 0.0.1 archiving Google.com and Google.com.hk
Known bugs:
1. 终端输出不能格式化
4. Wget 会遵循 robots.txt, 导致部分网站无法下载。(这个功能竟然不能在 wget 里关掉)
Fixed bugs:
2. 没有输入任何 URL 时若点击 Start Download 会导致界面被禁用。 (Fixed in 0.0.2)
3. Remove 按钮未实现。 (Fixed in 0.0.2)

下载:
WebArchiver-0.0.2.tar.bz2
WebArchiver 0.0.2
(30 KiB) 下载 216 次
展开直接运行 WebArchiver.py, 需要安装 python-qt4 运行环境。
例子:
要下载 http://abc.com/somepage.html, http://abc.com/somepage_2.html, ..., http://abc.com/somepage_11.html
则设置模板为, http://abc.com/somepage_*.html, 通配符长度为 1, 起始为 2, 结束为 11. 即可添加 2 到 11 页。然后在添加 http://abc.com/somepage.html,点击 Start Download 即可调用 Wget 下载。

Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)

发表于 : 2011-06-01 19:25
枫叶饭团
这个必须顶 :em11

Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)

发表于 : 2011-06-04 10:21
Bill Lee
修复了一个很严重的错误 (bug 3)
:em06
图片没更新

Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)

发表于 : 2014-02-23 14:48
andy_npf
WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端
收藏了

Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)

发表于 : 2014-03-14 10:18
fuhaoyun
这么好的东西,还在还在开发么 :em02