Python自动采集淘宝信息,了解下

2018-06-18 03:20:44来源:未知 阅读 ()

新老客户大回馈,云服务器低至5折

 

IDE:根据个人喜好

导入我们的第三方测试模块和时间模块

1 from selenium import webdriver
2 
3 import time

 

 

实战步骤流程

  1. 创造一个浏览器对象
  2. 输入要访问的网址
  3. 找到搜索框的唯一标示,并且给他一个变量保存可操作对象
  4. 输入我们要找的关键字.
  5. 找到对应ID的操作按钮标识,并且用变量保存按钮对象
  6. 点击按钮对象
  7. 创建一个文件
  8. 生成要翻页的页数.
  9. 控制浏览器的滚动条,让他加载数据
  10. 浏览器滚动结束以后,开始取出数据
  11. 遍历我们取出来的数据,取出每一个商品的信息
  12. 用xpath的语法去找到网页中的按钮标签
  13. 判断一下这个标签是否存在(异常处理)
  14. 实现翻页的功能

 

完整代码

 

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:python导包学习总结

下一篇:python列表删除元素及remove的奇怪现象