健康医疗大数据建模方法与应用最新章节_郭秀花著

本章小结

1.文本挖掘是数据挖掘的一种，是以计算机语言学、统计数理分析为理论基础，结合机器学习和信息检索技术，在大规模文本集合中发现并提取隐含的、以前未知的、潜在有用信息的过程。

2.文本挖掘的步骤主要包括：①文本获取；②文本预处理；③文本表示；④特征选择；⑤分类器分类/文本聚类。

3.语音识别包括特征识别、声学模型、语音模型等内容。

4.文本挖掘技术和语音识别技术都是计算机自然语言处理技术，随着人工智能相关科技的发展，这些领域与医学的相互融入日益加深，在临床和医学研究的应用范围也日益广泛。

（高　琦）