智能体编排产品调研：Multica & Sutra

一、调研背景

当前智能体编排（Agent Orchestration）正在成为新一代AI产品形态。与传统的BPA/RPA不同，这些产品让AI智能体像"队友"一样工作，而非简单的自动化脚本。本报告调研两个代表性产品，并与我们之前做的业务流程自动化产品做对比分析。

二、产品一：Multica

官网：https://www.multica.ai/

GitHub：https://github.com/multica-ai/multica 8.6K+ Stars Apache 2.0

定位：开源的"托管智能体"平台，Anthropic Claude Managed Agents 的开源替代

Tagline："Your next 10 hires won't be human"

核心能力

智能体即队友 — 像分配给同事一样给智能体分任务，智能体有个人资料，出现在看板上，参与评论，主动报告问题
自主执行 — 完整任务生命周期（入队→认领→执行→完成/失败），WebSocket 实时进度流
可复用技能系统 — 每个解决方案变成团队可复用技能（部署、迁移、代码审查等），技能随时间复利增长
统一运行时 — 单一仪表板管理所有计算资源，本地守护进程 + 云运行时混合
多工作区 — 跨团队组织，工作区级隔离

编排方式

任务看板驱动（不是可视化拖拽）

类似 GitHub Projects 的看板界面
自然语言描述任务 → 分配给智能体 → 智能体自主执行
支持 10+ 编码智能体引擎：Claude Code、Codex、GitHub Copilot CLI、Gemini CLI、Cursor Agent、Kiro CLI 等

技术架构

前端	Next.js 16 (App Router)
后端	Go 语言（Chi 路由器 + WebSocket）
数据库	PostgreSQL 17 + pgvector
部署	Docker Compose 自托管 or 云托管

目标用户

开发团队、想要自主控制的企业、多供应商用户、自托管优先组织

界面特征

任务看板视图（Board View），类似 GitHub Projects
实时进度追踪、活动时间线
智能体可在任务下评论和报告
现代响应式 UI，深色/浅色模式

三、产品二：Sutra

官网：https://sutra.gauravdatar.com/

GitHub：https://github.com/datar-gaurav/sutra-os

定位：完整堆栈的多智能体组织模拟平台

作者：Gaurav Datar（个人开源项目）

核心能力

多智能体讨论 — 支持头脑风暴、辩论、审查、站会、回顾等多种交互格式
组织结构模拟 — 角色、团队、组织图、报告层级（CEO、工程师、市场部等）
可视化工作流构建器 — 拖拽式 9+ 节点类型工作流（条件判断、循环、审批门等）
知识库 RAG — 文档上传、URL、文本内容的检索增强
人类在环治理 — 审批队列、风险级别控制、预算控制
三层内存系统 — 核心记忆、回忆、档案

编排方式

纯可视化拖拽编排

React Flow 驱动的工作流编辑器
节点类型：LLM 调用、工具执行、条件分支、循环、审批门、智能体委派
30+ 内置工具集成

技术架构

前端	Next.js 14 + React 18 + Tailwind CSS
后端	FastAPI + LangGraph + SQLAlchemy
数据库	PostgreSQL 16 + pgvector
队列	Redis 7 + Celery
状态管理	Zustand + TanStack React Query

目标用户

需要模拟完整组织、多角色协作的企业用户

界面特征

React Flow 拖拽工作流编辑器
组织图和团队管理界面
讨论/对话界面（多智能体实时交互）
SSE 驱动的流式实时聊天

四、Multica vs Sutra 对比

维度	Multica	Sutra
编排方式	任务看板驱动	可视化拖拽工作流
核心隐喻	智能体 = 队友	智能体 = 组织成员
技术栈	Go 后端 + Next.js 前端	Python FastAPI + Next.js
LLM 支持	多编码智能体引擎	多 LLM 提供商
主场景	编码开发任务	通用组织模拟
自托管	Docker Compose	Docker Compose + install.sh
社区规模	8.6K+ Stars	较小社区
商业化	有云版本	纯开源
人类在环	看板上直接交互	审批队列 + 风险控制
知识管理	技能系统复利	RAG 知识库 + 三层内存

五、与我们的业务流程自动化产品的差异分析

我们之前做的事情（BPA/流程AI）

核心原则："Process First" — AI 能力挂载在业务流程节点上
具体场景：财务预凭证生成、AI 审批助手、采购流程自动化
Skill 工程体系：开发→测试→部署，准确率验证、置信度分级、人工确认流
强调"AI 兜底推理"和"规则引擎配置"的结合
目标：让 AI 在确定的流程链路上做确定的事

关键差异

1. 编排对象不同

我们：编排的是"业务流程节点上的 AI 能力"（Skill）
他们：编排的是"自主决策的智能体"（Agent）
区别：我们的 Skill 是确定性的能力封装，他们的 Agent 是有自主判断的实体

2. 确定性 vs 自主性

我们：追求 95%+ 准确率，置信度分级，不确定的交给人
他们：接受智能体的不确定输出，通过迭代、重试、多 Agent 讨论来逼近结果
核心矛盾：业务流程要求"可靠"，智能体编排要求"灵活"

3. 流程驱动 vs 任务驱动

我们：沿着端到端业务流程链路，每个节点挂载能力
Multica：以任务为单位，智能体自主决定执行策略
Sutra：以组织模拟为隐喻，多角色协商决策

4. 适用场景

我们：高确定性业务（财务、审批、采购），错了代价大
他们：高探索性任务（编码、设计、研究），试错成本低

5. 与人的关系

我们：人是流程的参与者和最终审核者，AI 是执行工具
Multica：人和智能体是平等的队友
Sutra：人是管理者，智能体是组织成员

对我们产品设计的启发

可以借鉴的

技能复利机制（Multica）：我们的 Skill 体系本质上就是这个思路，但可以加强"团队级技能积累"的可视化
看板式编排：对于需要多个 Skill 串联的复杂业务，看板可能比固定流程图更灵活
多智能体讨论（Sutra）：在"AI 审批助手"场景中，多个专家 Agent 讨论审批意见可能有价值
人类在环治理（Sutra 的审批队列 + 风险级别）：可以增强我们现有的"人工确认流"

需要警惕的

不能照搬"智能体自主决策"模式到高确定性业务场景
"Agent as Teammate" 在 B 端企业落地时，合规和审计是大问题
编码场景的成功不代表能迁移到财务/采购等业务场景

产品方向思考

短期：保持 Process First，但在"流程节点"内部引入多 Agent 协商（比如审批场景下多个专家 Agent 给出建议）
中期：从"固定流程编排"演进到"流程模板 + 智能体灵活执行"，在确定的框架下给 Agent 一定自由度
长期：看业务场景成熟度，高频稳定场景保持规则驱动，新兴探索场景引入 Agent 自主编排

六、产品链接汇总

产品	官网	GitHub	文档
Multica	multica.ai	GitHub	Docs
Sutra	sutra.gauravdatar.com	GitHub	GitHub README

智能体编排产品调研：Multica & Sutra

目录

一、调研背景

二、产品一：Multica

核心能力

编排方式

任务看板驱动（不是可视化拖拽）

技术架构

目标用户

界面特征

三、产品二：Sutra

核心能力

编排方式

纯可视化拖拽编排

技术架构

目标用户

界面特征

四、Multica vs Sutra 对比

五、与我们的业务流程自动化产品的差异分析

我们之前做的事情（BPA/流程AI）

关键差异

1. 编排对象不同

2. 确定性 vs 自主性

3. 流程驱动 vs 任务驱动

4. 适用场景

5. 与人的关系

对我们产品设计的启发

可以借鉴的

需要警惕的

产品方向思考

六、产品链接汇总