购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

前言

在人工智能迅速发展的今天,数据与算法、算力共同构成人工智能的三大基本要素,发挥着至关重要的作用。其中,高质量的数据是人工智能性能的重要基石。大数据分析不仅成为企业创新和政府决策的关键支撑,更是推动人工智能与大模型性能持续提升的原动力。为顺应人工智能时代对高质量数据分析能力的需求,我们结合多年大数据分析课程教学的经验与成果,经过近两年的精心筹备与编写,推出了本书。

本书旨在为广大读者提供一个全面、系统且实用的大数据分析学习指南。我们不仅深入讲解了大数据分析的原理和方法,还提供了丰富的案例代码,帮助读者从理论走向实践,提高大数据分析工程实践能力。通过学习本书,读者将能够掌握大数据分析的核心概念、原理和技术,了解大数据分析平台的应用,并具备在实际项目中运用大数据分析解决问题的能力。

全书共分为六部分,每一部分都围绕大数据分析的关键环节展开,力求为读者构建一个完整、系统的学习体系。

第一部分为绪论,在此部分中简要介绍了大数据的基本概念、发展历程及其在各个领域的应用价值,为后续章节的学习打下坚实的理论基础。

第二部分为数据采集和预处理,此部分涵盖了数据源的识别与选择、数据抽取与清洗、数据转换与归约等关键步骤,确保读者能够掌握高质量数据的获取方法。

第三部分为数据存储,在此部分中深入探讨了数据物理存储系统和逻辑存储系统的相关原理,介绍了数据建模、分布式文件系统、NoSQL数据库以及图数据库等先进技术,旨在帮助读者理解如何构建高效、稳定的数据存储环境。

第四部分为数据处理,在此部分中全面介绍了各种数据处理系统的技术和方法,包括批数据处理、流数据处理、分布式图处理、处理架构、内存计算以及数据处理算法等,帮助读者掌握不同大数据处理模型的核心技术。

第五部分为大数据分析平台,在此部分中重点介绍了PyTorch、TensorFlow和Spark MLlib这三个主流的大数据分析平台,深入剖析了它们的框架原理、优势特点以及使用技巧,并通过实验案例帮助读者掌握这些大数据分析平台的使用方法和技巧。

第六部分为大数据应用,在此部分中精心选择了几种经典的大数据应用场景,包括数据可视化、文本分析、推荐系统、知识图谱以及社交网络分析等,详细介绍了这些应用的流程,并辅以案例分析和实现代码,帮助读者深入理解各种典型大数据分析应用的原理与实现过程。

此外,为了方便读者学习,我们还提供了大数据分析慕课作为本书的辅助学习资源。这些慕课内容丰富、讲解生动,可以帮助读者更好地理解和掌握大数据分析的相关知识。同时,本书也提供了实验源代码以及习题解析,这些学习资源可以通过扫描以下二维码获取。

众多研究生和本科生都热情参与了本书的编写工作。他们不仅协助我们完成了大量的撰写与校对工作,还为我们提供了宝贵的意见和建议。在此,我们要特别感谢叶润枝、吕宁、杨婧、吴国承、李灏、贾星辰、钟文清、韩若嘉、赵羽风、魏梦青、刘炳辉、陈轶飞、罗森、李艳茹、巩传龙、邹莹、马旭腾、万李锦芬、戚嘉亮、肖天一、张易从、张博凡、张卓远、张延硕、陈伊琳、张博汉、许婧雯等同学的大力支持和辛勤付出。

最后,我们衷心希望本书能够成为广大读者在大数据分析领域学习和实践的有力助手,帮助读者不断提升自己的大数据分析能力和工程实践能力。同时,我们也欢迎读者提出宝贵的意见和建议,以便我们不断完善和提升本书的质量。

让我们携手共进,迎接人工智能时代的挑战与机遇,共同创造美好的未来! vxuy1oArG/hDWINH80A77akCbx5Igf9XqRc5e4PjCznL+XqYH/+JYqgZ4ROUrs4f

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开