把技术资料网站给镜像下来离线浏览
- 飞火流星
- 帖子: 990
- 注册时间: 2010-05-11 21:50
Re: 把技术资料网站给镜像下来离线浏览
mark一下
有事多折腾。。。没事瞎折腾。。。
本本
acer 4745g i5-430 4G ATI5650 1G 独显 500G硬盘
台台
赛扬coppermine 1.0GHz 160MB内存 集成显声卡 网卡一块。
archlinux+xfce无压力
本本
acer 4745g i5-430 4G ATI5650 1G 独显 500G硬盘
台台
赛扬coppermine 1.0GHz 160MB内存 集成显声卡 网卡一块。
archlinux+xfce无压力
- momova
- 帖子: 3381
- 注册时间: 2007-07-11 21:43
- 系统: archlinux
- 来自: 东江边
Re: 把技术资料网站给镜像下来离线浏览
这个不是搜索引擎网站,是个wiki类的网站,主页面是搜索页面,其实不是。我喜欢这个网站下面的知道,所以想全部down下来。
binker 写了:你镜像的这个网站是一个搜索引擎网站,动态技术以及海量内容索引的的网站(和谷歌的网站同类型,后台都是分布式数据库),这些网站服务器规模都是很庞大的,如果镜像的话那些网络文件流量肯定很大的,我们的硬盘装不了那么多momova 写了:我这几天也想镜像一个网站。
用楼主的办法镜像不成功。楼主帮看看是怎么回事代码: 全选
$ wget -r -p -np -k -N -t 2 http://www.mbalib.com/ --2011-01-15 22:22:19-- http://www.mbalib.com/ 正在解析主机 www.mbalib.com... 110.80.7.42 正在连接 www.mbalib.com|110.80.7.42|:80... 已连接。 已发出 HTTP 请求,正在等待回应... 403 Forbidden 2011-01-15 22:22:20 错误 403:Forbidden。 已转换 0 个文件(在 0 秒之内)。
![]()
我一般就镜像一些比较小型的技术网站(整个网站内容加起来不超过10GB的),有的网站全部页面才500多MB,
我来了,我看见了,我征服了!
求勾搭,不管饭。
求勾搭,不管饭。
- momova
- 帖子: 3381
- 注册时间: 2007-07-11 21:43
- 系统: archlinux
- 来自: 东江边
- binker
- 帖子: 707
- 注册时间: 2008-09-10 11:54
Re: 把技术资料网站给镜像下来离线浏览
我试过了,在我的系统上面没有办法使用这个软件,用不了,不知道怎么回事,挺奇怪的momova 写了:我发现一个软件,好像比wget还厉害一点,httrack
- momova
- 帖子: 3381
- 注册时间: 2007-07-11 21:43
- 系统: archlinux
- 来自: 东江边
Re: 把技术资料网站给镜像下来离线浏览
用命令行下的,别用那个GUI啥的binker 写了:我试过了,在我的系统上面没有办法使用这个软件,用不了,不知道怎么回事,挺奇怪的momova 写了:我发现一个软件,好像比wget还厉害一点,httrack
我来了,我看见了,我征服了!
求勾搭,不管饭。
求勾搭,不管饭。
- binker
- 帖子: 707
- 注册时间: 2008-09-10 11:54
Re: 把技术资料网站给镜像下来离线浏览
嗯,已经装上了,命令行的momova 写了:用命令行下的,别用那个GUI啥的binker 写了:我试过了,在我的系统上面没有办法使用这个软件,用不了,不知道怎么回事,挺奇怪的momova 写了:我发现一个软件,好像比wget还厉害一点,httrack
正在镜像一个网站当中,,,,,,
()
- binker
- 帖子: 707
- 注册时间: 2008-09-10 11:54
Re: 把技术资料网站给镜像下来离线浏览
我又回去看了一下,也许你可以尝试镜像http://doc.mbalib.com(这是另外一台主机,)momova 写了:这个不是搜索引擎网站,是个wiki类的网站,主页面是搜索页面,其实不是。我喜欢这个网站下面的知道,所以想全部down下来。binker 写了:你镜像的这个网站是一个搜索引擎网站,动态技术以及海量内容索引的的网站(和谷歌的网站同类型,后台都是分布式数据库),这些网站服务器规模都是很庞大的,如果镜像的话那些网络文件流量肯定很大的,我们的硬盘装不了那么多momova 写了:我这几天也想镜像一个网站。
用楼主的办法镜像不成功。楼主帮看看是怎么回事代码: 全选
$ wget -r -p -np -k -N -t 2 http://www.mbalib.com/ --2011-01-15 22:22:19-- http://www.mbalib.com/ 正在解析主机 www.mbalib.com... 110.80.7.42 正在连接 www.mbalib.com|110.80.7.42|:80... 已连接。 已发出 HTTP 请求,正在等待回应... 403 Forbidden 2011-01-15 22:22:20 错误 403:Forbidden。 已转换 0 个文件(在 0 秒之内)。
![]()
我一般就镜像一些比较小型的技术网站(整个网站内容加起来不超过10GB的),有的网站全部页面才500多MB,
- momova
- 帖子: 3381
- 注册时间: 2007-07-11 21:43
- 系统: archlinux
- 来自: 东江边
Re: 把技术资料网站给镜像下来离线浏览
那是新开的一台服务器。
我想镜像的是http://wiki.mbalib.com/
不过听说全站镜像没经过允许是违法的?
而且一开始我用wget下载的时候还被屏蔽我的IP了。
我想镜像的是http://wiki.mbalib.com/
不过听说全站镜像没经过允许是违法的?
而且一开始我用wget下载的时候还被屏蔽我的IP了。
我来了,我看见了,我征服了!
求勾搭,不管饭。
求勾搭,不管饭。
- binker
- 帖子: 707
- 注册时间: 2008-09-10 11:54
Re: 把技术资料网站给镜像下来离线浏览
镜像下来仅供自己离线浏览不算违法,不要拿去做别的非法用途就行了,momova 写了:那是新开的一台服务器。
我想镜像的是http://wiki.mbalib.com/
不过听说全站镜像没经过允许是违法的?
而且一开始我用wget下载的时候还被屏蔽我的IP了。
http://wiki.mbalib.com/这个站点应该可以镜像的
- momova
- 帖子: 3381
- 注册时间: 2007-07-11 21:43
- 系统: archlinux
- 来自: 东江边
Re: 把技术资料网站给镜像下来离线浏览
镜像不了,过一定的时间氷被封IP了,要不你试试看。binker 写了:镜像下来仅供自己离线浏览不算违法,不要拿去做别的非法用途就行了,momova 写了:那是新开的一台服务器。
我想镜像的是http://wiki.mbalib.com/
不过听说全站镜像没经过允许是违法的?
而且一开始我用wget下载的时候还被屏蔽我的IP了。
http://wiki.mbalib.com/这个站点应该可以镜像的
我来了,我看见了,我征服了!
求勾搭,不管饭。
求勾搭,不管饭。
-
- 帖子: 49
- 注册时间: 2008-07-01 23:07
Re: 把技术资料网站给镜像下来离线浏览
这个非常的不错,我试过,很好很强大,挖咔咔,多谢楼主哈,mark了。。。 

-
- 帖子: 137
- 注册时间: 2010-02-03 12:00
Re: 把技术资料网站给镜像下来离线浏览
我用wget -m -k -np http://money.msn.com.cn/ 的时候显示404错误,这是怎么回事阿?浏览器可以正常访问。
错误显示如下
麻烦你帮忙看看吧,谢谢了!
错误显示如下
代码: 全选
user@user-laptop:~/文档/理财$ wget -m -k -np http://money.msn.com.cn/
--2011-03-20 09:26:30-- http://money.msn.com.cn/
正在解析主机 money.msn.com.cn... 61.164.153.166, 59.175.130.170, 220.181.54.10, ...
正在连接 money.msn.com.cn|61.164.153.166|:80... 已连接。
已发出 HTTP 请求,正在等待回应... 404 Not Found
2011-03-20 09:26:30 错误 404:Not Found。