发布于 2015-02-07 00:55:36 | 369 次阅读 | 评论: 0 | 来源: 网友投递
Python编程语言
Python 是一种面向对象、解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。
前面几篇都是以介绍基础知识为主,各位童鞋估计都在犯嘀咕了,你到底写不写爬虫啊??额,好吧,本文就给大家写一个简单的百度贴吧的python爬虫代码。
这里就不给大家废话了,直接上代码,代码的解释都在注释里面,看不懂的也别来问我,好好学学基础知识去!
bdurl = str(raw_input(u'请输入贴吧的地址,去掉pn=后面的数字:n'))
begin_page = int(raw_input(u'请输入开始的页数:n'))
end_page = int(raw_input(u'请输入终点的页数:n'))
#-------- 在这里输入参数 ------------------
#调用
baidu_tieba(bdurl,begin_page,end_page)
以上就是python抓取百度贴吧的一段简单的代码,非常的实用吧,各位可以自行扩展下。