购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第2章
文本分类

文本分类可以说是NLP里最传统的一个任务了,而且几乎所有的NLP任务最终都可以被视为文本分类的一种变化。例如,前面讲分词时的序列标注,就是对每个item进行一次分类。虽然翻译和文本摘要属于文本生成,但是在每次输出时要针对候选词表进行一次分类。即使是阅读理解的抽取式,也是把原文的长度作为候选表进行分类,而生成式阅读理解就跟翻译和摘要区别不大了。

本章讲解的文本分类是偏狭义的,即判断文本类别是二分类或多分类,当然也有可能是多级类别,例如商品,一级类别就是时装、数码等,二级类别就是女装、男装、手机和计算机等。

本章先介绍一些词向量的基础知识,然后介绍一些经典的文本分类模型。 dwYgFqvR68tO0ff6obfLO5FaXQsZzRoAlNoEy6htKA3bVWXHciC41SpGWbGyfNBk

点击中间区域
呼出菜单
上一章
目录
下一章
×