1.文本挖掘是数据挖掘的一种,是以计算机语言学、统计数理分析为理论基础,结合机器学习和信息检索技术,在大规模文本集合中发现并提取隐含的、以前未知的、潜在有用信息的过程。
2.文本挖掘的步骤主要包括:①文本获取;②文本预处理;③文本表示;④特征选择;⑤分类器分类/文本聚类。
3.语音识别包括特征识别、声学模型、语音模型等内容。
4.文本挖掘技术和语音识别技术都是计算机自然语言处理技术,随着人工智能相关科技的发展,这些领域与医学的相互融入日益加深,在临床和医学研究的应用范围也日益广泛。
(高 琦)