Java通过selenium自动化爬去数据

2018-06-21 06:52:26来源:未知 阅读 ()

新老客户大回馈,云服务器低至5折

Selenium,作为一个Web应用程序测试的工具。

1,配置selenium的路径和浏览器,我用的是firefox

webdriver.firefox.bin=D:/tools/firefox/firefox.exe
webdriver.gecko.driver=D:/project/geckodriver.exe
selenium.properties

分别为firefox的安装路径和firefox的驱动路径,这个驱动主要是驱动firefox自动打开,点击按钮等操作。

2,

public class Selenium{
    private static String driver = "";
    private static String fireFox = "";

    static {
        //读取配置文件中关于Selenium的配置
        Properties properties = new Properties();
        InputStream in = Object.class.getResourceAsStream("/selenium.properties");
        try {
            properties.load(in);
            //驱动路径
            driver = properties.getProperty("webdriver.gecko.driver");
            //浏览器路径
            fireFox = properties.getProperty("webdriver.firefox.bin");
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            try {
                in.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
  WebDriver webDriverPC = new FirefoxDriver();

  
public static void main(String[] args) {     String content = webDriverPC.get("http://www.baidu.com")   } }

 

这样就可以得到请求后的HTML,在用

Jsoup处理
Document doc = Jsoup.parse(content);
可得到里面的内容。

 

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:Java 11 快要来了,编译 & 运行一个命令搞定!

下一篇:Java爬虫爬取京东商品信息