学习爬虫的第一天
2019-05-24 06:12:46来源:博客园 阅读 ()
爬虫是什么?
网络就如同蜘蛛网,而数据相当于里面的节点,爬虫如同蜘蛛,通过节点去获取蜘蛛网上的内容,获取想要的数据信息
获取网页数据方式:
1、浏览器访问——下载网页数据
2、模拟浏览器对网页进行访问——解析数据——将所需要的内容保存在本地
其中第二种方式就是爬虫的整体流程
首先先了解下关于网页必备知识
https和http的区别?
http:明文显示,端口号为80
https:进行加密,添加数字证书,端口号为443
网络请求方式
GET
POST
PUT
HEAD
DELETE
PATCH
简单说下GET和POST区别
GET请求的特点:
*没有请求体,携带数据保存在URL后面
*GET请求携带的参数必须在4k之内
*GET请求的携带的数据由于封装在URL后面,所以会暴露在浏览器地址栏中
POST请求的特点:
*有请求体,数据保存在请求体中
*上传提交的数据可以无限大
*请求体中如果存在中文,会使用URL编码!
第一次写博客,过程不太熟悉,望大神们多加指导2019-05-23
原文链接:https://www.cnblogs.com/helloanita/p/10913943.html
如有疑问请与原作者联系
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
- 小白如何入门 Python 爬虫? 2019-08-13
- Python学习日记(十) 生成器和迭代器 2019-08-13
- python学习-53 正则表达式 2019-08-13
- python day2-爬虫实现github登录 2019-08-13
- python爬虫学习之爬取超清唯美壁纸 2019-08-13
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash