购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

三、用关联规则算法分析文本

我们在此要解决的问题是,当一个词语X出现时,哪些词语Y更可能同时出现,以及相反,当哪些词语X出现时,Y这个词语更可能出现。

在本章第 1部分中,我们利用chinese.misc包生成了了一个文档-词语矩阵dtm,这个矩阵每行代表一个人,相当于一笔交易,每列代表一个词语,相当于一个商品,因此关联规则算法适用于这个矩阵。

由于apriori函数只接受transactions对象,我们现在来对dtm进行转换。 zHec2V+4BQsBXDSeNNfxc8aAOJab4wmDvhgaD6Rdmpbzl7vcvKIQ5XAa8SKAYTNt

点击中间区域
呼出菜单
上一章
目录
下一章
×