首页 > 站长百科 > 网络编程

python通过正则获取网页上的全部链接

2018-07-20 来源：open-open

容器云强势上线！快速搭建集群，上万Linux镜像随意使用

import re, urllib
htmlSource = urllib.urlopen("http://www.sharejs.com").read(200000)
linksList = re.findall('<a href=(.*?)>.*?</a>',htmlSource)
for link in linksList:
    print link

标签：

版权申明：本站文章部分自网络，如有侵权，请联系：west999com@outlook.com
特别注意：本站所有转载文章言论不代表本站观点！
本站所提供的图片等素材，版权归原作者所有，如需使用，请与原作者联系。

上一篇:经典算法1：递归求解汉诺塔

下一篇:用几行Python代码实现一个简单的Web服务器

相关文章

最新资讯

热门推荐