购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第2章
开始爬虫

在第1章中已经了解了爬虫的相关知识,本章就开始实现爬虫。

爬虫的核心是模拟浏览器向服务器发送请求获取响应,Python提供了urllib库可以实现这些功能,使用者只需要按照要求传入对应的参数即可。为了简化使用,在urllib库的基础上做了包装,得到了一个requests模块,这样实现爬虫就更简单了。

本章重点讲解以下内容。

了解urllib模块实现爬虫

使用requests模块实现爬虫

使用re模块提取数据

爬百度贴吧 3oWD4FXuC2OSwqK5CeEq8TNFx5nJhWyNHjztYjT7Ap6AUtaTWmrjJtouZPz2lfcS

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开