[二星]程序开发,不限语言,抓取网页中的图片

除了美化之外,还可以来尝试挑战一下任务
回复
头像
月下叹逍遥
论坛版主
帖子: 33994
注册时间: 2010-10-07 14:23
系统: Archdows10
来自: 某系某星某洲某国某省某市
联系:

Re: [二星]程序开发,不限语言,抓取网页中的图片

#46

帖子 月下叹逍遥 » 2016-05-07 17:27

代码: 全选

# coding=utf-8

import re
import urllib.request
import os

def getHtml(url):
	page = urllib.request.urlopen(url)
	html = page.read().decode('utf-8')
	return html

def getImg(html):
	reg = r'src="(.+?\.jpg)"'
	imgre = re.compile(reg) 
	imglist = imgre.findall(str(html))
	print(imglist)
	x = 0
	try:
		os.mkdir("pic")
	except :
		pass

	for imgurl in imglist:
		try:
			conn = urllib.request.urlopen(imgurl)
			f = open("pic\{0}.jpg".format(x),'wb')
			f.write(conn.read())
			f.close()
			x=x+1	
		except :
			pass
	 
html = getHtml("http://www.gamersky.com/") 
getImg(html)

浮生七十今三十,从此凄惶未可知
回复