1.[单选题]下列不属于离散的词向量方法是()。
A.独热编码
B.词袋模型
C.TF-IDF模型
D.TextRank
2.[单选题]()不是词袋模型的缺陷。
A.无法保留次序信息
B.基于分布假说
C.维度灾难
D.存在语义鸿沟
3.[单选题]下列()可以作为NNLM模型输入层的输入。
A.独热编码
B.英文字母
C.字符串
D.中文汉字
4.[单选题]下列关于Word2vec说法正确的是()。
A.连续词袋模型(CBOW)是浅层神经网络模型
B.Skip-Gram是深度神经网络模型
C.CBOW和Skip-Gram都是深度神经网络模型
D.以上说法都不正确
5.[多选题]以下()不是文本向量化的常用方法。
A.Skip-Gram
B.EM
C.CBOW
D.viterbi
6.[单选题]利用gensim实现Word2vec时,()参数代表输出词向量的维度。
A.hs
B.min_count
C.size
D.window