多 Agent 设计技巧:
- 分工合作:大模型负责任务拆分与深度思考,小模型负责子任务执行与广度探索;二者配合,不但能实现并行推理,提高推理的速度和效率,还可以改善最终的任务完成效果
- 理解 Agent:观察并代入 Agent 的思考模式,并通过精准而有效的提示词来引导 Agent
- 任务分配:每个子 Agent 都需要有详细的任务目标、输出约束、工具和资源列表、任务边界;在合理的情况下,考虑通过子 Agent 的任务并行来加快效率(比如独立工具的并行调用)
- 根据查询复杂度调整工作规模:简单的信息收集仅需 1 个智能体,调用 3-10 次工具;直接比较可能需要 2-4 个子智能体,每个调用 10-15 次;而复杂研究可能使用超过 10 个子智能体,并明确划分职责
- 工具的设计与选择:首先检查所有可用的工具,并与用户意图匹配;优先选择专业工具而非通用工具,每个工具都需要明确的目的和清晰的描述;根据实际的工具使用体验,动态更新工具的描述和注意事项
- Agent 进化:自动诊断 Agent 的失败原因,并给出改进建议,实现经验积累与自我进化
- 探索策略:参考人类专家的研究策略,先整体规划,再逐步聚焦,缩小关注范围并深入细节
- 更新部署:注意规避代码改动对当前运行中的智能体的影响,考虑使用“彩虹部署策略”
彩虹部署(Rainbow Deploys)策略:一种渐进式发布策略,通过将用户流量按比例分配到新旧版本上实现平滑过渡,避免中断运行中的智能体,同时可能存在多版本(颜色)的同时运行
多 Agent 的优势:
- 应对存在动态性或分支探索的复杂决策路径
- 每个子 Agent 负责不同的视角,并具备独立性
- 适合处理存在并行任务、复杂工具交互的场景
anthropic 报告显示:以 Claude Opus 4 为领导智能体、Claude Sonnet 4 为子智能体的多智能体系统,在内部研究评估中比单智能体 Claude Opus 4 表现高出 90.2%
多 Agent 的不足:
- Token 消耗增加;相比于普通聊天,多智能体会增加约 15 倍 token 消耗
- 多 Agent 不适用于智能体之间存在大量依赖或需要共享上下文的场景
- 多 Agent 可能存在错误的累积,尤其是在智能体长时间运行或大量工具调用时
- 调试困难,问题难以定位,对多 Agent 的微小改动可能引发决策链路的变化