书籍目录
首页
分类
免费
排行
我的书架
1-50章
51-65章
共65章
免费
版权信息
免费
作者简介
免费
前言
免费
第1章 走进文本数据挖掘
免费
1.1 什么是文本数据挖掘
免费
1.2 为什么要做文本数据挖掘
免费
1.3 如何进行文本数据挖掘
免费
1.4 文本数据挖掘软件工具概览
免费
第2章 文本数据挖掘利器——R语言
免费
2.1 开发环境配置
免费
2.2 R的基本数据类型
免费
2.3 R的常用数据结构
免费
2.4 R的基础编程知识
2.5 数据操作入门
第3章 从基础做起1——字符串的基本处理
3.1 字符串的构造
3.2 字符串的辨识、计数与定位
3.3 字符串的提取
3.4 字符串的定制化输出
3.5 字符串的替换与删除
3.6 字符串的拼接与拆分
3.7 字符串的排序
第4章 从基础做起2——用好正则表达式
4.1 通配符解析
4.2 反向引用
4.3 简写字符集
4.4 贪婪匹配与惰性匹配
4.5 零宽断言
第5章 步入正题——导入各类文本数据
5.1 readtext包简介
5.2 不同格式文本文件的导入
5.3 读入不同编码格式的文档
5.4 文件数据结构的转化
第6章 更进一步——对各类文本数据进行预处理
6.1 拼写纠错
6.2 文本切分
6.3 去除标点
6.4 去除停用词
6.5 扩展缩写
6.6 词干提取
6.7 词形还原与词性标注
6.8 批量文档预处理
第7章 上手文本数据挖掘——文本特征提取的4种方法
7.1 基本特征提取
7.2 基于TF-IDF的特征提取
7.3 词嵌入
7.4 文档向量化:doc2vec
第8章 文本分类——基于机器学习的方法
8.1 无监督分类
8.2 有监督分类
×