企业 RAG 的竞争点正在从“能不能召回文本”转向“系统是否知道自己缺哪块上下文,并能否用可审计的多代理循环补齐”。短期判断不是采购哪家平台,而是把 corpus 描述、权限边界、充分性检查、benchmark 口径和失败回路纳入企业 AI 搜索评估。— Danding Editorial Desk
为什么重要
截至 2026-06-05,Google Research 官方博客与 Google Cloud 官方文档共同给出的信号是:企业 RAG 正从一次检索,走向跨 corpus 规划、检索、充分上下文检查、反馈和二次检索的可审计循环。本文引用的 34%、90.1%、within 3%、824 queries 与 2,676 PDF 等数字均为 FramesQA benchmark 特定实验口径,不是生产 SLA,也不代表 GA 可用性。
RAG 评估从召回率扩展到检索治理
Google Cloud 文档把 Cross Corpus Retrieval 描述为跨多个 RAG-managed corpora 的检索与回答能力,并强调 corpus description 会影响语料选择。这意味着企业不能只看向量库、召回率和模型名,还要看语料描述、路由计划、权限边界和可审计反馈。
充分上下文检查可能成为产品护栏
Google Research 文章把 Sufficient Context Agent 放在流程中,负责判断当前检索片段和中间草稿是否足以回答问题。这个机制如果被更多产品采用,RAG 产品评估就会多出“它何时知道自己不知道”的维度。
Google Research 在 2026-06-05 发布官方博客,称该 Agentic RAG 框架由 Google Research 与 Google Cloud 合作,面向 Gemini Enterprise Agent Platform。
02
截至 2026-06-05 的 Google Research 官方页,流程包含 Orchestrator、Planner Agent、Query Rewriter、Search Fanout Agent、Sufficient Context Agent 和最终 synthesis;这是官方描述的多代理检索流程,不等于每个企业场景的生产 SLA。
03
截至 2026-06-05 的 Google Research 官方页称,该框架在 factuality datasets 上相较 standard RAG 的 accuracy 最高提升 34%;该数字是 benchmark 特定结果,不能外推为真实企业负载表现。
04
截至 2026-06-05 的 Google Research 官方页称,FramesQA benchmark 有 824 queries 和包含 2,676 PDF documents 的 corpus;在 cross-corpus setting 中,系统回答正确率为 90.1%,且 single-corpus 与 cross-corpus 版本 latency 平均 within 3%。这些数字均属 FramesQA benchmark 口径,非生产 SLA。
05
Google Research 文章结尾称该能力以 public preview offering 形式在 Gemini Enterprise Agent Platform 中可用;本文不把它表述为 GA。
06
截至 2026-06-05 的 Google Cloud 官方文档说明,RAG Cross Corpus Retrieval 支持 AsyncRetrieveContexts 与 AskContexts 两类 API,并明确该 feature only available in us-central1。