检索增强生成(RAG)原理

什么是RAG?

检索增强生成(Retrieval-Augmented Generation,RAG)是一种将检索系统与大语言模型结合的技术,通过检索相关知识来增强模型的回答能力,提高响应的准确性和可靠性。

RAG的工作原理

  • 用户输入问题
  • 系统对问题进行向量化处理
  • 在知识库中检索相关文档
  • 将检索到的文档作为上下文注入到提示词中
  • 大语言模型基于上下文生成回答

RAG的主要组件

RAG的优势

常见应用场景