如何用Python把网站上面的文档教程制作成PDF?不…
2018-09-01 05:52:51来源:博客园 阅读 ()
人生苦短,我用Python。这句话我仅仅只是说说而已,Python丰富的库,意味着Python写代码的效率比其他的编程语言高出好几倍。Python的应用领域也特别的广,比如:web开发、爬虫、自动化测试/运维、测试/运维开发、大数据、数据分析、人工智能、机器学习等等。如果你是想要爬取网上数据的话,那肯定就是用Python了呀,毕竟很强大。
如果你需要一个良好的学习交流环境,那么你可以考虑Python学习交流群:548377875;
如果你需要一份系统的学习资料,那么你可以考虑Python学习交流群:548377875。
学习Python的朋友都知道"廖雪峰",也都会在上面看教程,但是总是用网页看感觉特别麻烦,今天小编就用Python把"廖雪峰"的教程制作成PDF,这样离线也能可以看了!
今天小编就是用Python爬虫中最为常用的两个模块,也是爬虫的两大神器了
Requests和beautifulsoup
首先咱们需要做的就是先安装这两个模块
- Pip install requests
- Pip install beautifulsoup
既然要把网页的html转换成PDF那么也要需要pdfkit这个模块的,和上面一样的安装方法。
接下来就是爬虫的基本的流程了
先在浏览器里面利用开发者工具(F12)找到正文的div标签,然后用requests获取整个页面数据,在用beautifulsoup提取正文内容。
简单明了
左侧的目录也可以用同样的方法找到。
实现源码
效果图
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
- python3基础之“术语表(2)” 2019-08-13
- python3 之 字符串编码小结(Unicode、utf-8、gbk、gb2312等 2019-08-13
- Python3安装impala 2019-08-13
- 小白如何入门 Python 爬虫? 2019-08-13
- python_字符串方法 2019-08-13
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash