购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

作者简介

黄天元,复且大学理学博士。热爱数据科学与开源工具,致力于利用数据科学迅速积累行业经验优势和科学知识发现,研究领域包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等。在CRAN上维护了3个下载量破万的R包( akc、tidyfst、tidyft ),著有《R语言高效数据处理指南》一书,开设有知乎专栏“R语言数据挖掘”,关注人数9000+。

文本是一种特殊的非结构化数据,在当今的大数据时代,其价值日趋凸显。本书利用开源而强大的R软件,对文本数据挖掘的概念、技术及技巧进行了系统的介绍。本书共11章,内容包括:走进文本数据挖掘,R语言快速入门,字符串的基本处理,用好正则表达式,导入各类文本数据,对各类文本数据进行预处理,文本特征提取的4种方法,基于机器学习的文本分类方法,文本情感分析,文本可视化,文本数据挖掘项目实践。本书还提供了丰富的应用案例和程序源代码引导读者高效学习。

本书适合对文本数据挖掘感兴趣的学生、科研人员和数据科学从业者阅读。同时,本书还可以作为工具书,为需要经常进行文本数据挖掘的读者提供快速检索。 PqfdQ7Jv+AnOtf49s+uWwcaLFjs14zVknJYGALxMPLpldCiaRXs1gICCY8h3a5kO

点击中间区域
呼出菜单
上一章
目录
下一章
×