python抓取页面 urllib2代码实现方式
浏览量:694
python抓取页面是实现方式:
#!/usr/bin/python
# -*- coding: utf-8 -*-
import urllib2
import cookielib
url = 'http://www.baidu.com'
print '第一种方法'
response1 = urllib2.urlopen(url)
print response1.getcode()
print len(response1.read())
print "第二种方法"
request = urllib2.Request(url)
request.add_header("user_agent","Mozilla/5.0")
response2 = urllib2.urlopen(url)
print response2.getcode()
print len(response2.read())
print "第三种方法"
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
urllib2.install_opener(opener)
response3 = urllib2.urlopen(url)
print response3.getcode()
print cj
print len(response3.read())
神回复
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
访客 回复该评论
发布于 2016-06-03 16:08:08
访客 回复该评论
发布于 2016-06-03 16:11:56