1.医学文本数据有哪些特点?
2.文本挖掘具体有哪些步骤?
3.中文文本与英文文本预处理的区别有哪些?
4.向量空间模型的含义及如何利用其提取特征?
5.简单说明声学模型和语言模型在语音识别系统中各自的作用。
1.下面不属于无词典分词的是( )。
A.正向最大匹配分词
B.最大熵模型
C.隐马尔可夫模型
D. N-gram模型
2.文本预处理不包括( )步骤。
A.文档分词
B.去停词
C.特征选择
D.建立语料库
3.分类效果评价指标中具有综合衡量作用的是( )。
A.精确率
B.召回率
C. F 1 值
D.准确率
4.下列哪种声音文件的格式属于无损格式( )。
A. MIDI
B. MP3
C. AAC
D. WAV
5.关于语音识别的基本流程,以下排序正确的是( )。
①预处理
②特征提取
③信号输入
④声学模型
⑤语言模型
A. ③①②④⑤
B. ③②①④⑤
C. ③①⑤④②
D. ①③②④⑤
6.在汉语的语音识别中,最常用的声学模型建模单元是( )。
A.音节
B.音素
C.声韵母
D.整词