Python 爬取网页中JavaScript动态添加的内容(二…

2018-09-29 03:59:05来源:博客园 阅读 ()

新老客户大回馈,云服务器低至5折

使用 selenium + phantomjs 实现

1、准备环境

selenium(一个用于web应用程测试的工具)安装:pip install selenium
phantomjs(是一种无界面的浏览器,用于完成网页的渲染)下载:http://phantomjs.org/download.html

2、使用

from selenium import webdriver

url = 'http://jandan.net/ooxx'
driver = webdriver.PhantomJS(
    executable_path='D:/Software/phantomjs-2.1.1-windows/bin/phantomjs.exe')  # 如果没有配置phantomjs的环境变量,需要手动指定路径
driver.get(url)
print(driver.page_source)

 

 

 

 

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:Python的22个编程技巧,请收下!

下一篇:用Python爬下今日头条所有美女,美滋滋!