前言

Scrapy是一个用Python语言编写的网络爬虫框架。它应用广泛——从数据挖掘到监控和自动化测试。它目前由Zyte公司维护，前身为Scrapinyhub公司，这是一家网络抓取和服务公司。本书介绍使用Scrapy开发网络爬虫应用。

本书共8章，第1章介绍网络爬虫开发快速入门；第2章介绍Python开发快速入门；第3章介绍使用Python开发网络爬虫；第4章介绍从互联网提取信息；第5章介绍使用Scrapy开发爬虫；第6章介绍分布式爬虫开发；第7章介绍如何开发网络爬虫用户界面；第8章介绍网络爬虫案例。

本书适合需要具体实现网络爬虫应用的开发人员或者对网络爬虫等相关领域感兴趣的人士参考，同时猎兔搜索技术团队已经开发出本书配套的培训课程和商业软件。

本书中的一些内容和现有的一些开源项目Scrapy等共同成长和发展。由于作者水平有限，书中疏漏之处在所难免，敬请广大读者朋友批评指正。

感谢早期合著者、合作伙伴、员工、学员、读者的支持，给我们提供了良好的工作基础，就像玻璃容器中的水培植物一样，这是一个持久可用的成长基础，技术的融合与创新无止境，欢迎一起探索。