下载掌阅APP，畅读海量书库

立即打开

畅读海量书库

扫码下载掌阅APP

第2章
开始爬虫

在第1章中已经了解了爬虫的相关知识，本章就开始实现爬虫。

爬虫的核心是模拟浏览器向服务器发送请求获取响应，Python提供了urllib库可以实现这些功能，使用者只需要按照要求传入对应的参数即可。为了简化使用，在urllib库的基础上做了包装，得到了一个requests模块，这样实现爬虫就更简单了。

本章重点讲解以下内容。

了解urllib模块实现爬虫

使用requests模块实现爬虫

使用re模块提取数据

爬百度贴吧

点击中间区域
呼出菜单

购买书籍时，会优先扣除您的代金券，再扣除阅饼；当您的余额不足时，可使用微信或支付宝支付，补足差价；
连载书籍勾选自动购买下一章后，会自动扣费，已购章节不会重复扣费；
书籍购买记录请至我的—购书记录中查询

上一章

目录

下一章

×

打开