1 任务内容: 分析优酷的链接并保存视频,可以考虑在html5模式下抓取。
2 任务的难度: 三星
3 任务的目的: 脚本掌握
4 任务所涉及的软件: Ubuntu
5 任务将大致消耗的时间: 1周
[三星]脚本抓取youku.com的视频
- oneleaf
- 论坛管理员
- 帖子: 10441
- 注册时间: 2005-03-27 0:06
- 系统: Ubuntu 12.04
- eexpress
- 帖子: 58428
- 注册时间: 2005-08-14 21:55
- 来自: 长沙
Re: [三星]脚本抓取youku.com的视频
没js实时解析的,脚本咋搞得定。而且youku的js监视广告播放,跳不过去。
如果外挂的,flash-down.pl 早发过。
html5的没看过啊。还要伪装成手机浏览器?
如果外挂的,flash-down.pl 早发过。
html5的没看过啊。还要伪装成手机浏览器?
● 鸣学
- oneleaf
- 论坛管理员
- 帖子: 10441
- 注册时间: 2005-03-27 0:06
- 系统: Ubuntu 12.04
Re: [三星]脚本抓取youku.com的视频
最后一句正解。
- eexpress
- 帖子: 58428
- 注册时间: 2005-08-14 21:55
- 来自: 长沙
-
- 帖子: 482
- 注册时间: 2013-09-13 0:42
- 系统: Debian sid
Re: [三星]脚本抓取youku.com的视频
只要获取一个视频的VID, 就可以取得它的所有格式的视频地址.
比较麻烦的是分类, 但总体来说, youku.com里面用的页面模板并不多, 比cntv少很多了.
手头上正在进行的项目(还没写完, 没发布), 里面有youku的部分, 下面附加的代码就是解析用户页面的, 主要解析本用户的基本信息, 所有视频和专辑.
还有其它页面, 比如soku的搜索页, starpage, showpage, playpage, categoriesPage等, 也类似, 但还没写完.
这是解析模块, 得到的数据可以通过数据模块保存下来, 比如存到数据库中. 用python来写的, 舒服
比较麻烦的是分类, 但总体来说, youku.com里面用的页面模板并不多, 比cntv少很多了.
手头上正在进行的项目(还没写完, 没发布), 里面有youku的部分, 下面附加的代码就是解析用户页面的, 主要解析本用户的基本信息, 所有视频和专辑.
还有其它页面, 比如soku的搜索页, starpage, showpage, playpage, categoriesPage等, 也类似, 但还没写完.
这是解析模块, 得到的数据可以通过数据模块保存下来, 比如存到数据库中. 用python来写的, 舒服
您没有权限查看这个主题的附件。
-
- 帖子: 482
- 注册时间: 2013-09-13 0:42
- 系统: Debian sid
Re: [三星]脚本抓取youku.com的视频
可能我理解错了, 如果只想从某个链接地址中得到视频下载地址的话, 也有不少现成的开源项目:
比如, 我之前发过的, https://github.com/wenketel/monkey-videos 是js脚本.
另一个, you-get https://github.com/soimort/you-get , 是用python3写的.
https://github.com/rg3/youtube-dl, 这个是国外朋友维护的, 也支持几个国内视频网站.
比如, 我之前发过的, https://github.com/wenketel/monkey-videos 是js脚本.
另一个, you-get https://github.com/soimort/you-get , 是用python3写的.
https://github.com/rg3/youtube-dl, 这个是国外朋友维护的, 也支持几个国内视频网站.
- oneleaf
- 论坛管理员
- 帖子: 10441
- 注册时间: 2005-03-27 0:06
- 系统: Ubuntu 12.04
- mjp123
- 帖子: 702
- 注册时间: 2009-04-09 15:06
Re: [三星]脚本抓取youku.com的视频
m3u8用vlc看。eexpress 写了:html5的看不了。