12306模拟登陆、验证码破解,Python资深大牛深度…
2018-06-23 13:17:16来源:未知 阅读 ()
全文都是Python知识干货,没有一句多余的废话!
1.Python爬虫原理
网络爬虫:自动的按照我们制定的规则,下载互联网上网络资源的程序。
爬虫的本质:伪造网络请求(90%是http请求)
用途:搜索引擎,数据采集,测试分析
狭义定义:伪造浏览器行为的程序!
2.浏览器工作流程
本质上:浏览器就是一个客户端,它通过http请求从服务器下载数据,解析渲染
展示给用户。
任何一个网页都是n个http请求回的数据组成。
我们在浏览器中看到的所有的信息都是从服务器下载而来。
3.http请求的分析
视频教程+
1.请求头
url method,header
2.请求体
参数
抓包
谷歌浏览器 开发者 调试工具
顺序方法:手动的操作一遍流程,记录所有的http请求
分析http请求,没有捷径,只有耐心,细心和经验。
会话技术
业务流程:
cookie保持
1.访问登录页面
url = 'https://kyfw.12306.cn/otn/login/init'
method = get
2.下载验证码
url = 'https://kyfw.12306.cn/passport/captcha/captcha-image?login_site=E&module=login&rand=sjrand&0.785280601210562'
method = get
3.校验验证码
url = 'https://kyfw.12306.cn/passport/captcha/captcha-check'
method = post
表单数据:
answer: 183,51,40,116
login_site: E
rand: sjrand
4.校验用户名密码
url = 'https://kyfw.12306.cn/passport/web/login'
method = post
表单数据:
username: wcfdehao
password: 123456
appid: otn
5.获取权限token
url = 'https://kyfw.12306.cn/passport/web/auth/uamtk'
method = post
表单数据:
appid: otn
6.获取权限
url = https://kyfw.12306.cn/otn/uamauthclient
method = post
表单数据:
tk: 依赖上一次请求的数据
4.requests库的介绍
安装:pip install requests
python3 pycharm
5.文件操作
相关命令看Python基础手册即可。
6.Python模拟登陆12306相关步骤
第一步 :访问登录页面
第二步:下载验证码
第三步:校验验证码
第四步:校验用户名和密码
第五步:获取权限token
第六步:获取权限
7.Python源代码
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
上一篇:4.字典
- python爬虫学习之淘宝模拟登录 2019-08-13
- python爬虫登陆网页版腾讯课堂 2019-07-24
- 利用Python模拟登录pastebin.com 2019-07-24
- python学习教程,12306火车票抢票系统 2019-07-24
- python_装饰器之页面登陆验证 2019-07-24
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash