RAG 检索增强生成

RAG 是大模型落地企业知识库、私有数据问答的标准范式。本章从Naive RAG 到 Agentic RAG 全覆盖。

本章内容

Naive RAG 与瓶颈 — 索引、检索、生成三段式与已知问题
RAG 选型面试深挖 — 托管知识库、自建向量库、评估指标与退出条件
文档切分策略 — 固定 / 语义 / 递归 / 延迟切分
嵌入模型选型 — BGE、E5、OpenAI、Voyage、Cohere 实测
向量数据库对比 — Pinecone、Weaviate、Qdrant、Milvus、Chroma、pgvector
混合检索 — BM25 + 向量融合方案与 RRF
重排序 — 交叉编码器、Cohere Rerank、BGE-Reranker
高级 RAG — HyDE、Step-back、Self-RAG、Corrective RAG
GraphRAG 图增强检索 — Microsoft 图增强检索方案深度剖析
Agentic RAG — 把检索当工具的 Agent 模式
RAG 评估方法 — RAGAS、TruLens、DeepEval 实战

学习路径

先建立 Naive RAG 的端到端理解（从文档到答案的完整链路）
准备项目深挖时看 RAG 选型面试深挖，先把方案取舍讲清楚
重点优化两个组件：切分策略 和 嵌入模型
进入生产必加 混合检索 + 重排序，召回率立刻起飞
进阶看 高级 RAG / GraphRAG / Agentic RAG，按场景选用
上线前一定要做 RAG 评估，不能凭感觉