发布于 2014-10-23 04:53:26 | 175 次阅读 | 评论: 0 | 来源: 网友投递
Python编程语言
Python 是一种面向对象、解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。
本文是一个python实现的可以爬取百度贴吧,并下载网页保存到本地的示例代码,感兴趣的同学参考下.
测试url:http://tieba.baidu.com/p/27141123322?pn=
begin 1
end 4
def baidu_tieba(url,begin_page,end_page):
for i in range(begin_page, end_page+1):
sName = string.zfill(i,5)+ '.html'
print '正在下载第' + str(i) + '个网页,并将其存储为' + sName + '..........'
f = open (sName,'w+')
m = urllib2.urlopen(url + str(i)).read()
f.write(m)
f.close()
bdurl = str(raw_input('url: n'))
begin_page = int(raw_input('begin :n'))
end_page = int(raw_input('end : n'))
baidu_tieba(bdurl,begin_page,end_page)