购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

练习题

一、思考题

1.医学文本数据有哪些特点?

2.文本挖掘具体有哪些步骤?

3.中文文本与英文文本预处理的区别有哪些?

4.向量空间模型的含义及如何利用其提取特征?

5.简单说明声学模型和语言模型在语音识别系统中各自的作用。

二、选择题

1.下面不属于无词典分词的是( )。

A.正向最大匹配分词

B.最大熵模型

C.隐马尔可夫模型

D. N-gram模型

2.文本预处理不包括( )步骤。

A.文档分词

B.去停词

C.特征选择

D.建立语料库

3.分类效果评价指标中具有综合衡量作用的是( )。

A.精确率

B.召回率

C. F 1

D.准确率

4.下列哪种声音文件的格式属于无损格式( )。

A. MIDI

B. MP3

C. AAC

D. WAV

5.关于语音识别的基本流程,以下排序正确的是( )。

①预处理

②特征提取

③信号输入

④声学模型

⑤语言模型

A. ③①②④⑤

B. ③②①④⑤

C. ③①⑤④②

D. ①③②④⑤

6.在汉语的语音识别中,最常用的声学模型建模单元是( )。

A.音节

B.音素

C.声韵母

D.整词 98hqcZpKsuZKZbMcxWlw+l/+3jCW8azOUzOaO6B7uVZconQmrgckodYs7K/b5wh+

点击中间区域
呼出菜单
上一章
目录
下一章
×