python通过正则获取网页上的全部链接

2018-07-20    来源:open-open

容器云强势上线!快速搭建集群,上万Linux镜像随意使用
import re, urllib
htmlSource = urllib.urlopen("http://www.sharejs.com").read(200000)
linksList = re.findall('<a href=(.*?)>.*?</a>',htmlSource)
for link in linksList:
    print link

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:经典算法1:递归求解汉诺塔

下一篇:用几行Python代码实现一个简单的Web服务器