我们在此要解决的问题是,当一个词语X出现时,哪些词语Y更可能同时出现,以及相反,当哪些词语X出现时,Y这个词语更可能出现。
在本章第 1部分中,我们利用chinese.misc包生成了了一个文档-词语矩阵dtm,这个矩阵每行代表一个人,相当于一笔交易,每列代表一个词语,相当于一个商品,因此关联规则算法适用于这个矩阵。
由于apriori函数只接受transactions对象,我们现在来对dtm进行转换。 zHec2V+4BQsBXDSeNNfxc8aAOJab4wmDvhgaD6Rdmpbzl7vcvKIQ5XAa8SKAYTNt