发布于 2014-09-27 09:40:01 | 159 次阅读 | 评论: 0 | 来源: 网友投递
Python编程语言
Python 是一种面向对象、解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。
本文是用python写的一个采集爬虫脚本,以多玩图片为目标,实现了自动下载妹子图片的代码,代码可能有点老,大家只参考他的思路即可.感兴趣的同学参考下.
def getImageUrl(data): #将获取到img链接写到sour.txt文件中国
sour = open("test\sour.txt", 'w')
pplen = len("http://s1.dwstatic.com/group1/M00/37/2A/e2c30e89184ea942a4be9c1f7ba217a5.jpg")
for i in range(len(data) - 3):
if data[i] == 'i' and data[i + 1] == 'm' and data[i + 2] == 'g':
for j in xrange(i + 9, i + 9 + pplen):
sour.write(data[j])
sour.write('n')
sour.close()
def downImage(): #根据test\sour.txt里面的url自动下载图片
tt = 0 #name
sour = open('test\sour.txt')
while 1:
line = sour.readline()
if line:
Len = len(line)
#print Len
if line[Len - 2] == 'g' and line[Len - 3] == 'p' and line[Len - 4] == 'j':
path = line
data = urllib.urlopen(line).read()
f = open('test\' + str(tt) + '.jpg', 'wb')
f.write(data)
f.close()
tt = tt + 1
else:
break
sour.close()
content = getContent()
getImageUrl(content)
downImage()