发布于 2014-10-12 21:57:24 | 60 次阅读 | 评论: 0 | 来源: 网友投递

这里有新鲜出炉的Python3 Cookbook中文版,程序狗速度看过来!

Python编程语言

Python 是一种面向对象、解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。


本文是一个python抓取网页中图片的示例代码,主要是分析网页中src标签,需要的朋友可以参考下


#coding:utf8
import re
import urllib
def getHTML(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

 

def getImg(html,imgType):
    reg = r'src="(.*?.+'+imgType+'!slider)" '
    imgre = re.compile(reg)
    imgList = re.findall(imgre, html)
    x=0
    for imgurl in imgList:
        print imgurl
        urllib.urlretrieve(imgurl, '%s.%s' % (x, imgType))
        x =x+1


html= getHTML("http://www.phperz.com")

getImg(html,'jpg')

 



相关阅读 :
python抓取网页中的图片示例
python抓取网页正文的示例代码
python抓取网页中图片并保存到本地
python抓取网页图片示例(python爬虫的实现)
python实现的批量抓取某站美女图片示例
python抓取网页图片并放到指定文件夹
python抓取网页内容示例
Python 抓取网页并且解析的方法
python使用正则表达式分析网页中的图片并进行替换的方法
Python实现周期性抓取网页内容的方法
python 3利用BeautifulSoup抓取div标签的方法示例
python抓取网页时字符集转换方法
最新网友评论  共有(0)条评论 发布评论 返回顶部
月排行榜

Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务