Python抓取天气信息并存储原来这么简单
2019-04-12 09:32:06来源:博客园 阅读 ()
data:image/s3,"s3://crabby-images/f6a70/f6a70d4a33f0f5a1c5e969441789b7c3ae7b480e" alt="新老客户大回馈,云服务器低至5折"
我们计划抓取的数据:杭州的天气信息
实现数据抓取的逻辑:使用python 请求 URL,会返回对应的 HTML 信息,我们解析 html,获得自己需要的数据。(很简单的逻辑)
第一步:创建 Python 文件
data:image/s3,"s3://crabby-images/132d3/132d3cd94861d5d75adf779b199781d677e7f0d8" alt=""
写第一段Python代码
data:image/s3,"s3://crabby-images/85547/855476a2ebe75589d248926c51c10e023db9e45d" alt=""
这段代码类似于 Java 中的 Main 方法。可以直接鼠标右键,选择 Run。
data:image/s3,"s3://crabby-images/9fab5/9fab5e8f8267cadcc28a965673e859b2804dbcbb" alt=""
第二步:请求RUL
python 的强大之处就在于它有大量的模块(类似于Java 的 jar 包)可以直接拿来使用。
我们需要安装一个 request 模块: File - Setting - Product - Product Interpreter
data:image/s3,"s3://crabby-images/97b61/97b618e8fa1522f8a3cf3e5d2c778082612b1b88" alt=""
data:image/s3,"s3://crabby-images/2533c/2533c7fb3aa5c19c0974cb3ded42ae9ce158a704" alt=""
点击如上图的 + 号,就可以安装 Python 模块了。搜索 requests 模块(有 s 噢),点击 Install。
data:image/s3,"s3://crabby-images/44ec4/44ec4c42914291ce9903f3405d64c3670b89bff1" alt=""
我们顺便再安装一个beautifulSoup4 和 pymysql模块,beautifulSoup4 模块是用来解析 html 的,可以对象化 HTML 字符串。pymysql 模块是用来连接 mysql 数据库使用的。
data:image/s3,"s3://crabby-images/e5803/e5803c18c59d15ff4ee38fa366f1eef5e51d6147" alt=""
data:image/s3,"s3://crabby-images/fde35/fde350238fde028d2149b2d23d854e01309025e0" alt=""
相关的模块都安装之后,就可以开心的敲代码了。
定义一个 getContent 方法:
data:image/s3,"s3://crabby-images/a2b56/a2b56e51455775880bf386dfc48524d863e144ab" alt=""
在 main 方法中调用:
data:image/s3,"s3://crabby-images/cac3f/cac3f1034eca163a60a22fc65dcc7088e9e2b2ad" alt=""
第三步:分析页面数据
定义一个 getData 方法:
data:image/s3,"s3://crabby-images/20bf7/20bf75ebc8f0d86180245ae7a75f9f7852e5bc7f" alt=""
上面的解析其实就是按照 HTML 的规则解析的。可以打开杭州天气在开发者模式中(F12),看一下页面的元素分布。
data:image/s3,"s3://crabby-images/29c3f/29c3f5870bf93d4254dbc41620b82fa513b051d4" alt=""
在 main 方法中调用:
data:image/s3,"s3://crabby-images/2ae9f/2ae9f10f122a41daaba26bc2730f00f9f9f75ddd" alt=""
数据写入excel
现在我们已经在 Python 中拿到了想要的数据,对于这些数据我们可以先存放起来,比如把数据写入 csv 中。
定义一个 writeDate 方法:
data:image/s3,"s3://crabby-images/df8a1/df8a120b86ef0b517b7d84081ded2e9130861c6d" alt=""
在 main 方法中调用:
data:image/s3,"s3://crabby-images/d534e/d534e613bde8519ea6c1cd7c2ec0ece075603a3b" alt=""
执行之后呢,再指定路径下就会多出一个 weather.csv文件,可以打开看一下内容。
data:image/s3,"s3://crabby-images/cafbc/cafbcdff6084f41aadb9e134ec8d57370dd4ebf8" alt=""
data:image/s3,"s3://crabby-images/56983/5698346a6e5ebda97a6589da75c5bf2de924bd16" alt=""
到这里最简单的数据抓取--储存就完成了。
原文链接:https://www.cnblogs.com/Pythonmiss/p/10695809.html
如有疑问请与原作者联系
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
下一篇:while else
- python3基础之“术语表(2)” 2019-08-13
- python3 之 字符串编码小结(Unicode、utf-8、gbk、gb2312等 2019-08-13
- Python3安装impala 2019-08-13
- 小白如何入门 Python 爬虫? 2019-08-13
- python_字符串方法 2019-08-13
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash