模拟浏览器——Headers属性
2018-06-18 02:04:17来源:未知 阅读 ()
具体有哪些http请求头部信息可以在浏览器调试工具(一般按F12)中查看
方法一、使用build_opener()修改报头
1 import urllib.request
2
3 url = "https://www.cnblogs.com"
4 # 根据需要在headers里添加更多信息
5 headers = [
6 ("accept-language", "zh-CN,zh;q=0.9"),
7 ("User-Agent", "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36")
8 ]
9 opener = urllib.request.build_opener()
10 opener.addheaders = headers # 设置的头信息为列表格式,每个字段对应里面一个元组
11 data = opener.open(url).read()
12 # 若使用install_opener(opener)将opener安装为全局,以后调用urlopen()时都会使用安装的opener对象
13 # urllib.request.install_opener(opener)
14 # data = urllib.request.urlopen(url).read()
15 print(data)
方法二、使用add_header()添加报头
1 import urllib.request
2
3 url = "http://blog.csdn.net/column.html"
4 req = urllib.request.Request(url)
5 req.add_header("accept-language", "zh-CN,zh;q=0.9")
6 req.add_header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36")
7 data = urllib.request.urlopen(req).read()
8 print(data)
如果要查看添加的headers字段是否成功,可以用抓包工具,如fiddler具体查看
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
下一篇:python学习三:列表,元组
- python爬虫学习之淘宝模拟登录 2019-08-13
- 整合 User-Agent 大全汇总 2019-07-24
- 利用Python模拟登录pastebin.com 2019-07-24
- 爬虫 2019-06-13
- python初体验 ——>>> 模拟体育竞技 2019-05-13
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash