1.4 RAG的优缺点
1.4.1 RAG的优点
前面介绍了RAG的基础内容,下面来具体梳理一下RAG的优点。
1.高质量的答案生成,降低答案生成的幻觉
RAG的一个优点是它能够生成高质量的回答。因为在生成过程中,检索器可以从大量文档中检索问题相关的信息,然后基于这些信息生成回答。这使得整个系统能够充分利用现有知识生成更准确、更具深度的回答,也意味着模型出现幻觉答案的概率更小。
在图1-1和图1-2中,我们分别询问了ChatGPT和Bing Chat两个问题:“RAG是什么?”“为什么大模型都是Decoder结构?”。可以明显感受到,使用了RAG的Bing Chat对自己的答案更加自信,并且给出的答案更加专业。而ChatGPT的结果更倾向于罗列各种可能性,它并不知道近期这些名词在哪些领域更热门。
2.可扩展性
RAG具有很好的可扩展性,这意味着它可以轻松地适应新的数据和任务。由于RAG采用了检索—生成的框架,因此只需更新检索部分的数据,就可以使模型适应新的知识领域。这使得RAG在面对新领域或不断更新的知识库时具有很强的适应性。
3.模型可解释性
RAG具有一定程度的可解释性,这意味着我们可以理解模型是如何生成回答的。由于RAG的特性,我们可以很容易地追溯模型是从哪些文档中提取信息的。这使得我们可以评估模型的回答是否基于可靠的数据来源,从而提高模型的可信度。例如,在前面图1-2的例子中,Bing Chat不仅回答了我们提出的问题,还给出了模型从哪些文档中提取了信息。如果这些文档来自权威的科学出版物或者知名的网站,那么我们就可以相信模型的回答是准确的。
4.成本效益
由于RAG的知识库能够与生成模型解耦,因此只要拥有一定的数据量,企业便可将RAG作为微调的替代方法,而微调可能需要大量资源。这种模式对中小企业非常友好。从另一个角度来看,由于企业的数据都是私有的,提供相关文档作为背景信息可以使生成结果更加准确、更具实用性,以满足企业的特定任务需求。