Contextual Retrieval

本文是中文精读笔记，不是原文全文翻译。

这篇文章解决什么问题

RAG 把文档切成 chunk 后，单个 chunk 往往失去原文上下文。检索时，即使 chunk 里有答案，也可能因为语义不完整而召回失败。Contextual Retrieval 的思路是在入库前给每个 chunk 加上文档级上下文说明。

Contextual Retrieval 解决的是 RAG 里非常常见的“chunk 失忆”问题。文档切分后，一个片段可能只包含“这个指标同比增长 12%”，但没有说明“这个指标”是什么、来自哪家公司、属于哪一年报表。向量检索看到这个 chunk 时，很难把它和用户问题准确匹配。

Anthropic 的思路是在入库前，用模型基于原文档给每个 chunk 生成简短上下文说明，再把说明和 chunk 一起进入检索索引。这样 chunk 不再是孤立片段，而是带着文档级背景。对 embedding 检索，它增强语义；对 BM25，它增加关键字；对后续生成，它减少模型猜上下文的压力。

这个方法的工程关键在“短而准”。上下文说明太长会增加成本和噪声；说明不准确会把幻觉写进索引，之后每次检索都会放大错误。因此它适合高价值文档库，需要配合批处理、缓存、抽检和回滚。