购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

前言

当前,我国已经进入以大数据为核心资源的数字经济时代,党的二十大报告也提出要“加快建设数字中国”“加快发展数字经济,促进数字经济和实体经济深度融合”。现阶段,我国在科学技术和经济发展方面,对海量数据采集需求迫切,提取与存储这些数据是进一步实现数据分析的关键与前提,在大数据的研究和应用中,网络爬虫已经成为自动获取互联网海量数据的主要方式。

2021年11月30日,工业和信息化部发布《“十四五”大数据产业发展规划》,明确提出要加强大数据人才培养力度。本书作为大数据技术知识入门教材,主要介绍大数据爬虫及其相关最新技术的基本理论、关键知识和实际应用,旨在为读者搭建通向关于“大数据爬取、分析和挖掘”的大数据知识空间的桥梁,让广大师生对大数据爬虫技术的应用方法和相关知识有所了解,为培养具备数据意识、数据思维和数据能力的人才奠定基础。

本书特色如下。

(1)遵循“项目任务驱动、知识传授和能力培养融合、价值塑造”的教材编写原则,依据任务复杂度,按照“由浅入深”的原则设置知识进阶,将案例与理论融合,循序渐进地介绍爬虫技术的相关知识点。内容设计符合学习者的认知习惯,体现了“成果为导向,学生为中心”的教学理念。同时,结合大数据技术等专业的特点,每个项目以价值引领目标为抓手,实现了价值观教育和专业技术知识教育的有效融合,引导学生在努力学习的同时,树立强国报国的志向。

(2)整体采用活页式编写风格,每个任务基本上由实施任务单、知识准备组成,每个部分均可以独立使用。学习者可通过任务单明确学习目标和任务要求,激发学习动力;通过知识准备学习理论知识和操作技能;通过评量单明确学习实践中存在的不足;通过课后习题或实训题目测试自己对知识的掌握程度。

(3)本书提供相关代码,读者可以参考书中代码编写爬虫。需要注意的是,商业网站更新速度快,在实际使用中可能会遇到网站改版的情况,读者应重点学习编写爬虫的思路、技巧和方法。为了更好地帮助读者使用本书和方便教师授课,本书提供了相关在线课程资源,可到智慧树平台搜索“网络爬虫开发”在线开放课程(网址https://coursehome.zhihuishu.com/courseHome/1000064833/152938/19#teachTeam),观看本书配套视频、下载教学资源。编者团队成员均参与了在线开放课程的制作,该在线课程在2022年被列为教育部社区教育“能者为师”首批推介系列特色课程(“科学素质与互联网学习”主题系列课程)。

本书在撰写过程中,得到了王金龙副教授、杨兰副教授的大力支持,感谢他们对本书提出了宝贵建议和意见。同时本书参考了大量国内外资料、专著等,在此对相关作者一并表示感谢。因编者水平有限,书中难免存在不足之处,恳请广大读者批评指正。

编 者
2023年9月 jlvT/pXwtsZ0GfOHe0bgOG5fNxTfxYPO6g3IjTsW13Ptp308nDRSZEqSiQLjjSXI

点击中间区域
呼出菜单
上一章
目录
下一章
×