大语言模型(Large Language Model,LLM,简称大模型)是通过大量数据训练而成的模型,能够生成连贯文本、理解自然语言并回答问题。作为基础技术,LLM提供了强大的语言理解和生成能力,构成了复杂人工智能系统的基石。
RAG(Retrieval-Augmented Generation,检索增强生成)是当前备受关注的LLM前沿技术之一。它结合了传统信息检索技术和最新的生成式模型,首先从大型知识库中检索与查询最相关的信息,然后基于这些信息生成回答。可以说,RAG是在LLM基础上的扩展或应用,利用LLM的生成能力和外部知识库的丰富信息提供更准确、更全面的输出。
简单来说,RAG是一种方法,在将提示词(prompt)发送给LLM之前,先从数据中找到并注入相关信息片段。这样,LLM能够获得预期的相关信息,并据此进行回复,从而减少幻觉的可能性。
在本章中,我们将从LLM应用的基本模式入手,逐步引入RAG的核心概念、组成结构及其应用场景。同时,我们还将深入探讨与RAG相关的各种技术体系,以期为读者提供全面的内容。