分页: 1 / 2
[原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-04-08 21:18
由 hecha

搞了一下午, 终于搞好了
要求 python3, 用 wget 下载, 所以中文文件名乱码
用法:
代码: 全选
$ ./gmusic.py 魔杰座
发送查询: 魔杰座
获取歌曲列表...
0 魔杰座 周杰伦 MP3 6.3 MB
1 龙战骑士 周杰伦 MP3 6.3 MB
2 稻香 周杰伦 MP3 5.2 MB
3 蛇舞 周杰伦 MP3 4.1 MB
4 时光机 周杰伦 MP3 7.3 MB
5 说好的幸福呢 周杰伦 MP3 6.0 MB
6 给我一首歌的时间 周杰伦 MP3 5.9 MB
7 兰亭序 周杰伦 MP3 5.9 MB
8 东方之殿 周杰伦 MP3 4.1 MB
9 花海 周杰伦 MP3 6.2 MB
选择要下载的歌曲['all' 或 '1, 2 3']:
可以直接写多个关键词
刚才编译了 wget 1.11 , 中文文件名不会乱码了, 用它覆盖 /usr/bin/wget 即可.
再发个 mp3 标签编码转换工具
代码: 全选
$ ./mp3unicode -sgbk -2unicode -p *.mp3
Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-04-08 21:23
由 xhy
如何解决验证码问题的?
Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-04-08 21:23
由 yaoms
这个支持下

Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-04-08 21:25
由 hecha
xhy 写了:如何解决验证码问题的?
需要验证码吗?
我没遇到啊, Cookies 清除过的, 都不用输验证码
Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-04-08 21:28
由 xhy
hecha 写了:xhy 写了:如何解决验证码问题的?
需要验证码吗?
我没遇到啊, Cookies 清除过的, 都不用输验证码
数量达到一定程度的时候,点击下载会出现验证码
google的普通搜索和音乐搜索都使用了验证码阻止bot的大量访问
我以前做过爬google搜索结果的东西,清cookies没用,它是记录在server的,跟IP绑定
Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-04-08 21:29
由 kissdb
已发出 HTTP 请求,正在等待回应... 403 Forbidden
2009-04-08 21:29:25 错误 403:Forbidden。
Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-04-08 21:32
由 hecha
xhy 写了:数量达到一定程度的时候,点击下载会出现验证码
google的普通搜索和音乐搜索都使用了验证码阻止bot的大量访问
我以前做过爬google搜索结果的东西,清cookies没用,它是记录在server的,跟IP绑定
这样啊, 每首歌都要花上几十秒, 不会短时间大量下载的, 应该没多大问题吧, 不知道它是不是限制 ip
Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-04-08 21:34
由 hecha
kissdb 写了:已发出 HTTP 请求,正在等待回应... 403 Forbidden
2009-04-08 21:29:25 错误 403:Forbidden。
那个错误信息是 wget 的, 你看看下载地址有没有问题?
Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-04-08 21:45
由 xhy
hecha 写了:xhy 写了:数量达到一定程度的时候,点击下载会出现验证码
google的普通搜索和音乐搜索都使用了验证码阻止bot的大量访问
我以前做过爬google搜索结果的东西,清cookies没用,它是记录在server的,跟IP绑定
这样啊, 每首歌都要花上几十秒, 不会短时间大量下载的, 应该没多大问题吧, 不知道它是不是限制 ip
我手动下了百来首,就出验证码了
Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-04-08 21:50
由 hecha
xhy 写了:我手动下了百来首,就出验证码了

那就下一百首, 上 google 输入一次验证码
Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-04-08 23:37
由 dsl138
不错,使用中
Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-04-09 14:20
由 eagle5678
好

Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-04-09 15:48
由 ccbeing
下来学习学习先
Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-09-24 19:00
由 redface999
请教一下你是怎么知道google音乐的下载页面为“/music/top100/musicdownload?id=S208897f61863160e”的 我前一阵也写了一个下载google音乐的python代码,我通过观察页面源文件,发现下载页面为“/music/url?q\x3dhttp%3A%2F%2Fg.top100.cn%2F12174704%2Fhtml%2Fdownload.html%3Fid%3DS208897f61863160e”(
http://g.top100.cn/12174704/html/downlo ... f61863160e),我这个下载页面通过浏览器能看到正确的下载页面,但是用urllib下载页面则不是那个真正的下载页面。
邮箱:
[email protected] 刚刚学习python (
http://dashen2009.blog.51cto.com/714741/199981这是我的那一篇帖子,当时时还不知道有HTMLParser,惭愧惭愧)
Re: [原创] 搜索下载谷歌音乐的脚本
发表于 : 2009-09-24 20:01
由 hecha
这个脚本写了很久了, 都记不清了, 好像是先从搜索结果页面找到 id 如 S208897f61863160e, 下载地址的形式是在下载的那个小窗口中找到的, 就是 /music/top100/musicdownload?id=S208897f61863160e, 替换了一下 id