tnfh.net
当前位置:首页 >> python3 urlliB rEAD >>

python3 urlliB rEAD

使用方法 import urllib.request url="http://www.baidu.com" get=urllib.request.urlopen(url).read() print(get)

urllib2是python2自带的模块,不需要下载。urllib2在python3.x中被改为urllib ,你直接输入urllib就可以了 >>>import urllib下图是我电脑上的Python3.5版本的

你试试这个 def getHtml(self,url): request = urllib2.Request(url, headers=headers) response = urllib2.urlopen(request) return response.read().decode('utf-8')

ubuntu 的控制台默认是utf8编码的吧。而且这个google返回的是big5编码吗,用下面的代码解码下试试 url="网址" content = urllib2.urlopen(url).read() print content.decode('big5').encode('utf8')

urllib.request.urlopen 就是打开url网址的操作,参数可以是一个url,也可以是一个request对象,作用是一样的,上面的代码中 response就是上一步得到的request对象。

def getUrlRespHtml(url): heads = {'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8', 'Accept-Charset':'GB2312,utf-8;q=0.7,*;q=0.7', 'Accept-Language':'zh-cn,zh;q=0.5', 'Cache-Control':'max-age=0', 'Conn...

python 3.x中urllib库和urilib2库合并成了urllib库。。其中urllib2.urlopen()变成了urllib.request.urlopen() urllib2.Request()变成了urllib.request.Request() ……

返回的是html字符串类型。

#导入包 import urllib.request #获取访问页面的内容,html为字符串html = urllib.request.urlopen('这里是网址').read() #打印html的类型print(type(html)) #打开777.html文件f = open("777.html", "wb") #将html的内容写入到777.html中f.write...

#python 3.3 import urllib.parse,urllib.request,http.cookiejar,recookie = http.cookiejar.CookieJar() cookieProc = urllib.request.HTTPCookieProcessor(cookie) opener = urllib.request.build_opener(cookieProc) urllib.request.install...

网站首页 | 网站地图
All rights reserved Powered by www.tnfh.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com