本书系统介绍了自然语言处理及深度学习,并结合实际应用场景和综合案例,深入浅出地讲解自然语言处理领域的相关知识。
全书共15章,分为4个部分。第1部分是自然语言处理基础,首先介绍自然语言处理的相关概念和基本技能,然后介绍词向量技术和实现方法,最后介绍关键词提取技术。第2部分是自然语言处理核心技术,分别介绍朴素贝叶斯算法、N-gram语言模型、PyTorch深度学习框架、FastText模型文本分类和基于深度学习的文本分类。第3部分是序列标注,介绍序列标注的具体应用,如HMM词性标注和HMM命名实体识别等常见的自然语言处理应用场景。第4部分是预训练模型,它在很大程度上促进了自然语言处理的发展,这部分内容关注预训练模型的具体应用,如ALBERT的命名实体识别、Transformer的文本分类、BERT的文本相似度计算、ERNIE的情感分析等。
本书适合对人工智能、机器学习、深度学习和自然语言处理感兴趣的读者阅读,也可以作为应用型本科院校和高等职业院校人工智能相关专业的教材。