智能体编排产品调研:Multica & Sutra

Agent Orchestration 产品形态与业务流程自动化的差异分析

一、调研背景

当前智能体编排(Agent Orchestration)正在成为新一代AI产品形态。与传统的BPA/RPA不同,这些产品让AI智能体像"队友"一样工作,而非简单的自动化脚本。本报告调研两个代表性产品,并与我们之前做的业务流程自动化产品做对比分析。


二、产品一:Multica

官网https://www.multica.ai/

GitHubhttps://github.com/multica-ai/multica 8.6K+ Stars Apache 2.0

定位:开源的"托管智能体"平台,Anthropic Claude Managed Agents 的开源替代

Tagline"Your next 10 hires won't be human"

核心能力

  1. 智能体即队友 — 像分配给同事一样给智能体分任务,智能体有个人资料,出现在看板上,参与评论,主动报告问题
  2. 自主执行 — 完整任务生命周期(入队→认领→执行→完成/失败),WebSocket 实时进度流
  3. 可复用技能系统 — 每个解决方案变成团队可复用技能(部署、迁移、代码审查等),技能随时间复利增长
  4. 统一运行时 — 单一仪表板管理所有计算资源,本地守护进程 + 云运行时混合
  5. 多工作区 — 跨团队组织,工作区级隔离

编排方式

任务看板驱动(不是可视化拖拽)

  • 类似 GitHub Projects 的看板界面
  • 自然语言描述任务 → 分配给智能体 → 智能体自主执行
  • 支持 10+ 编码智能体引擎:Claude Code、Codex、GitHub Copilot CLI、Gemini CLI、Cursor Agent、Kiro CLI 等

技术架构

前端Next.js 16 (App Router)
后端Go 语言(Chi 路由器 + WebSocket)
数据库PostgreSQL 17 + pgvector
部署Docker Compose 自托管 or 云托管

目标用户

开发团队、想要自主控制的企业、多供应商用户、自托管优先组织

界面特征

  • 任务看板视图(Board View),类似 GitHub Projects
  • 实时进度追踪、活动时间线
  • 智能体可在任务下评论和报告
  • 现代响应式 UI,深色/浅色模式

三、产品二:Sutra

官网https://sutra.gauravdatar.com/

GitHubhttps://github.com/datar-gaurav/sutra-os

定位:完整堆栈的多智能体组织模拟平台

作者:Gaurav Datar(个人开源项目)

核心能力

  1. 多智能体讨论 — 支持头脑风暴、辩论、审查、站会、回顾等多种交互格式
  2. 组织结构模拟 — 角色、团队、组织图、报告层级(CEO、工程师、市场部等)
  3. 可视化工作流构建器 — 拖拽式 9+ 节点类型工作流(条件判断、循环、审批门等)
  4. 知识库 RAG — 文档上传、URL、文本内容的检索增强
  5. 人类在环治理 — 审批队列、风险级别控制、预算控制
  6. 三层内存系统 — 核心记忆、回忆、档案

编排方式

纯可视化拖拽编排

  • React Flow 驱动的工作流编辑器
  • 节点类型:LLM 调用、工具执行、条件分支、循环、审批门、智能体委派
  • 30+ 内置工具集成

技术架构

前端Next.js 14 + React 18 + Tailwind CSS
后端FastAPI + LangGraph + SQLAlchemy
数据库PostgreSQL 16 + pgvector
队列Redis 7 + Celery
状态管理Zustand + TanStack React Query

目标用户

需要模拟完整组织、多角色协作的企业用户

界面特征

  • React Flow 拖拽工作流编辑器
  • 组织图和团队管理界面
  • 讨论/对话界面(多智能体实时交互)
  • SSE 驱动的流式实时聊天

四、Multica vs Sutra 对比

维度 Multica Sutra
编排方式任务看板驱动可视化拖拽工作流
核心隐喻智能体 = 队友智能体 = 组织成员
技术栈Go 后端 + Next.js 前端Python FastAPI + Next.js
LLM 支持多编码智能体引擎多 LLM 提供商
主场景编码开发任务通用组织模拟
自托管Docker ComposeDocker Compose + install.sh
社区规模8.6K+ Stars较小社区
商业化有云版本纯开源
人类在环看板上直接交互审批队列 + 风险控制
知识管理技能系统复利RAG 知识库 + 三层内存

五、与我们的业务流程自动化产品的差异分析

我们之前做的事情(BPA/流程AI)

  • 核心原则:"Process First" — AI 能力挂载在业务流程节点上
  • 具体场景:财务预凭证生成、AI 审批助手、采购流程自动化
  • Skill 工程体系:开发→测试→部署,准确率验证、置信度分级、人工确认流
  • 强调"AI 兜底推理"和"规则引擎配置"的结合
  • 目标:让 AI 在确定的流程链路上做确定的事

关键差异

1. 编排对象不同

  • 我们:编排的是"业务流程节点上的 AI 能力"(Skill)
  • 他们:编排的是"自主决策的智能体"(Agent)
  • 区别:我们的 Skill 是确定性的能力封装,他们的 Agent 是有自主判断的实体

2. 确定性 vs 自主性

  • 我们:追求 95%+ 准确率,置信度分级,不确定的交给人
  • 他们:接受智能体的不确定输出,通过迭代、重试、多 Agent 讨论来逼近结果
  • 核心矛盾:业务流程要求"可靠",智能体编排要求"灵活"

3. 流程驱动 vs 任务驱动

  • 我们:沿着端到端业务流程链路,每个节点挂载能力
  • Multica:以任务为单位,智能体自主决定执行策略
  • Sutra:以组织模拟为隐喻,多角色协商决策

4. 适用场景

  • 我们:高确定性业务(财务、审批、采购),错了代价大
  • 他们:高探索性任务(编码、设计、研究),试错成本低

5. 与人的关系

  • 我们:人是流程的参与者和最终审核者,AI 是执行工具
  • Multica:人和智能体是平等的队友
  • Sutra:人是管理者,智能体是组织成员

对我们产品设计的启发

可以借鉴的

  1. 技能复利机制(Multica):我们的 Skill 体系本质上就是这个思路,但可以加强"团队级技能积累"的可视化
  2. 看板式编排:对于需要多个 Skill 串联的复杂业务,看板可能比固定流程图更灵活
  3. 多智能体讨论(Sutra):在"AI 审批助手"场景中,多个专家 Agent 讨论审批意见可能有价值
  4. 人类在环治理(Sutra 的审批队列 + 风险级别):可以增强我们现有的"人工确认流"

需要警惕的

  1. 不能照搬"智能体自主决策"模式到高确定性业务场景
  2. "Agent as Teammate" 在 B 端企业落地时,合规和审计是大问题
  3. 编码场景的成功不代表能迁移到财务/采购等业务场景

产品方向思考

  • 短期:保持 Process First,但在"流程节点"内部引入多 Agent 协商(比如审批场景下多个专家 Agent 给出建议)
  • 中期:从"固定流程编排"演进到"流程模板 + 智能体灵活执行",在确定的框架下给 Agent 一定自由度
  • 长期:看业务场景成熟度,高频稳定场景保持规则驱动,新兴探索场景引入 Agent 自主编排

六、产品链接汇总

产品 官网 GitHub 文档
Multica multica.ai GitHub Docs
Sutra sutra.gauravdatar.com GitHub GitHub README