RAG 很多人都听说过,或者实践过,目前最直接的应用就是构建智能问答系统。
什么是 RAG?
RAG 是 Retrieval Augmented Generation 的简写,翻译过来就是检索增强生成。
为什么需要用到 RAG 呢?
大模型"幻觉"的问题一直存在,RAG 是缓解其幻觉的一个很重要的途径,当然还有其他缓解的方式,SFT 这些。
有几点比较重要的优势吧。
外挂知识,可以增加 LLM 推理的能力、准确性,能够更加复合客观事实。
知识库增删修改更加方便,遇到 bug 及时修复知识库,或者更新知识库即可,基本是用户没有感知的状态,不像 SFT 还需要重新训练,耗费时间。
再就是可解释性,通过工程手段,可以给出合理的引用链接,增加可信度,比如现在做的一些智能搜索,后面会列出答案来自的链接。