python图片小爬虫

2018-07-20    来源:open-open

容器云强势上线!快速搭建集群,上万Linux镜像随意使用
import re  
import urllib  
import os  
  
def rename(name):   
    name = name + '.jpg'  
    return name    
  
def getHtml(url):  
    page = urllib.urlopen(url)  
    html = page.read()  
    return html  
  
def getImg(html):  
    reg = r'src="(.+?\.jpg)" pic_ext'  
    imgre = re.compile(reg)  
    imglist = re.findall(imgre,html)  
      
      
    os.chdir("E:\\pic")    
    os.getcwd()   
    x=1  
    for imgurl in imglist:  
        img=urllib.urlopen(imgurl)  
            
          
        name=str(x)    
        name = rename(name)    
        print(name)   
        x=x+1  
          
        f=open(name,'wb')  
        f.write(img.read())   
        f.close()  
   
   
   
      
html = getHtml("http://tieba.baidu.com/p/3553148164")  
getImg(html)  
print 'pic save!'  

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:Python 发送带附件的email

下一篇:python通过pil生成缩略图的简单代码