Signal · AI Frontier
多 Agent 系统最贵的噪音,可能是 Agent 之间的闲聊
多 Agent 系统常把注意力放在角色和调度上,但真正吃掉上下文窗口的,可能是 Agent 之间未经约束的自然语言交接。PACT 的价值在于把“怎么说话”变成成本和可靠性问题。
发布于 2026-06-07Danding Signals Editorial Desk人工审核AI 辅助整理,人工审核

核心判断
多 Agent 产品不一定需要更多角色,而需要更可控的通信格式;否则共享上下文会被对话噪音快速吃掉,token 成本也会随协作复杂度上升。— Danding Editorial Desk为什么重要
截至 2026-06-07,arXiv abs 页显示 PACT 论文 v1 于 2026-06-03 提交,并附 GitHub 链接 github.com/iNLP-Lab/PACT。论文摘要称,自由文本式 Agent 通信会膨胀 token usage、消耗 shared context window,并影响 system performance 与 inference cost。
Agent 协作的瓶颈可能是上下文治理
企业把任务拆给多个 Agent 后,如果每个 Agent 都长篇解释,成本和错误传播会同步上升。结构化交接让团队有机会保留行动状态,删掉冗余解释。
通信协议可能比换模型更划算
如果同样模型在更好的交接格式下能减少 token 或保持 resolve,产品团队可以先优化系统设计,而不是一味升级到更贵模型。
可审计状态有助于人工复核
action-state record 更接近日志和状态机,也更容易让人类 reviewer 看清 Agent 为什么把任务交给下游。
关键事实
- 01
arXiv abs 页显示论文 v1 于 2026-06-03 提交,题为 What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems。
- 02
论文摘要称 LLM multi-agent systems 常按 roles、pipelines 和 turn schedules 组织,但 agents 传递的内容常是未约束自然语言。
- 03
摘要称自由文本通信会膨胀 token usage、消耗 shared context window,并影响 system performance 与 inference cost。
- 04
论文称分析了 5 种常见 inter-agent communication strategies 和 2 种 MAS topologies,并认为没有一种固定策略普遍最优。
- 05
论文提出 PACT,将 raw agent output 投射为 compact action-state record 再进入 shared history。
- 06
按 arXiv 摘要原文口径,PACT 在 OpenHands 上提升 resolve rate,且为 -10% tokens-per-resolved;在 SWE-agent 上 resolve 持平,输入 token 减半。
不确定性
- PACT 的任务设置、基线、统计显著性和代码复现仍需继续核对;摘要结果不能直接外推到所有多 Agent 企业任务。
- OpenHands 与 SWE-agent 是 coding harness 语境,非编码任务、客服流程和研究流程可能得到不同收益。
- 协议层会增加设计和调试复杂度,是否值得取决于任务拓扑、失败代价和团队日志治理能力。
后续观察
- 01
核对 github.com/iNLP-Lab/PACT 的代码、复现实验、license 和后续 issue。
- 02
观察 LangGraph、AutoGen、CrewAI、OpenHands、SWE-agent 等框架是否加入 action-state 交接结构。
- 03
跟踪真实产品里多 Agent 交接失败的主要原因是上下文冗余、状态遗漏还是工具调用错误。
- 04
寻找非编码任务上的 PACT 或同类结构化通信评测。