从零开始学Scrapy网络爬虫：视频教学版最新章节_张涛著

下载掌阅APP，畅读海量书库

立即打开

畅读海量书库

扫码下载掌阅APP

本章首先介绍了浏览器访问网站服务器的过程；接着讲解了HTML网页的组成和结构；最后实现了使用XPath提取网页信息。这正是网络爬虫运行的核心步骤，即模拟浏览器发送请求，服务器返回网页，然后解析网页信息。通过本章的学习，为网络爬虫的开发打下了坚实的理论基础。

点击中间区域
呼出菜单