购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

作业与练习

1.[单选题]下列不属于离散的词向量方法是()。

A.独热编码

B.词袋模型

C.TF-IDF模型

D.TextRank

2.[单选题]()不是词袋模型的缺陷。

A.无法保留次序信息

B.基于分布假说

C.维度灾难

D.存在语义鸿沟

3.[单选题]下列()可以作为NNLM模型输入层的输入。

A.独热编码

B.英文字母

C.字符串

D.中文汉字

4.[单选题]下列关于Word2vec说法正确的是()。

A.连续词袋模型(CBOW)是浅层神经网络模型

B.Skip-Gram是深度神经网络模型

C.CBOW和Skip-Gram都是深度神经网络模型

D.以上说法都不正确

5.[多选题]以下()不是文本向量化的常用方法。

A.Skip-Gram

B.EM

C.CBOW

D.viterbi

6.[单选题]利用gensim实现Word2vec时,()参数代表输出词向量的维度。

A.hs

B.min_count

C.size

D.window Afe3sHdHW6WgI2qfq0Luk44hESKboPw1YDpu+jZ+6a1kvT2cEYKtt6slBwttvx/H

点击中间区域
呼出菜单
上一章
目录
下一章
×