网络爬虫实现的思想是模拟用户使用浏览器向网站发送请求,网站响应请求后,将HTML文档发送过来,爬虫再对网页做信息提取和存储。因此,了解浏览器与网站服务器之间的通信方式和交互过程,理解HTML页面的组织和结构,掌握页面信息的提取和存储技术,能进一步加深对网络爬虫原理的理解。 i7Hz0RRNwIaj/8iDBsfeeHmcT6fj+H+AhLmmR7S5T/a03btBj8pbB2i3MdaF+mU4