python抓取页面 urllib2代码实现方式
浏览量:690
python抓取页面是实现方式:
#!/usr/bin/python # -*- coding: utf-8 -*- import urllib2 import cookielib url = 'http://www.baidu.com' print '第一种方法' response1 = urllib2.urlopen(url) print response1.getcode() print len(response1.read()) print "第二种方法" request = urllib2.Request(url) request.add_header("user_agent","Mozilla/5.0") response2 = urllib2.urlopen(url) print response2.getcode() print len(response2.read()) print "第三种方法" cj = cookielib.CookieJar() opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj)) urllib2.install_opener(opener) response3 = urllib2.urlopen(url) print response3.getcode() print cj print len(response3.read())
神回复
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
访客 回复该评论
发布于 2016-06-03 16:08:08
访客 回复该评论
发布于 2016-06-03 16:11:56