一、调研背景
当前智能体编排(Agent Orchestration)正在成为新一代AI产品形态。与传统的BPA/RPA不同,这些产品让AI智能体像"队友"一样工作,而非简单的自动化脚本。本报告调研两个代表性产品,并与我们之前做的业务流程自动化产品做对比分析。
二、产品一:Multica
GitHub:https://github.com/multica-ai/multica 8.6K+ Stars Apache 2.0
定位:开源的"托管智能体"平台,Anthropic Claude Managed Agents 的开源替代
Tagline:"Your next 10 hires won't be human"
核心能力
- 智能体即队友 — 像分配给同事一样给智能体分任务,智能体有个人资料,出现在看板上,参与评论,主动报告问题
- 自主执行 — 完整任务生命周期(入队→认领→执行→完成/失败),WebSocket 实时进度流
- 可复用技能系统 — 每个解决方案变成团队可复用技能(部署、迁移、代码审查等),技能随时间复利增长
- 统一运行时 — 单一仪表板管理所有计算资源,本地守护进程 + 云运行时混合
- 多工作区 — 跨团队组织,工作区级隔离
编排方式
任务看板驱动(不是可视化拖拽)
- 类似 GitHub Projects 的看板界面
- 自然语言描述任务 → 分配给智能体 → 智能体自主执行
- 支持 10+ 编码智能体引擎:Claude Code、Codex、GitHub Copilot CLI、Gemini CLI、Cursor Agent、Kiro CLI 等
技术架构
| 前端 | Next.js 16 (App Router) |
| 后端 | Go 语言(Chi 路由器 + WebSocket) |
| 数据库 | PostgreSQL 17 + pgvector |
| 部署 | Docker Compose 自托管 or 云托管 |
目标用户
开发团队、想要自主控制的企业、多供应商用户、自托管优先组织
界面特征
- 任务看板视图(Board View),类似 GitHub Projects
- 实时进度追踪、活动时间线
- 智能体可在任务下评论和报告
- 现代响应式 UI,深色/浅色模式
三、产品二:Sutra
官网:https://sutra.gauravdatar.com/
GitHub:https://github.com/datar-gaurav/sutra-os
定位:完整堆栈的多智能体组织模拟平台
作者:Gaurav Datar(个人开源项目)
核心能力
- 多智能体讨论 — 支持头脑风暴、辩论、审查、站会、回顾等多种交互格式
- 组织结构模拟 — 角色、团队、组织图、报告层级(CEO、工程师、市场部等)
- 可视化工作流构建器 — 拖拽式 9+ 节点类型工作流(条件判断、循环、审批门等)
- 知识库 RAG — 文档上传、URL、文本内容的检索增强
- 人类在环治理 — 审批队列、风险级别控制、预算控制
- 三层内存系统 — 核心记忆、回忆、档案
编排方式
纯可视化拖拽编排
- React Flow 驱动的工作流编辑器
- 节点类型:LLM 调用、工具执行、条件分支、循环、审批门、智能体委派
- 30+ 内置工具集成
技术架构
| 前端 | Next.js 14 + React 18 + Tailwind CSS |
| 后端 | FastAPI + LangGraph + SQLAlchemy |
| 数据库 | PostgreSQL 16 + pgvector |
| 队列 | Redis 7 + Celery |
| 状态管理 | Zustand + TanStack React Query |
目标用户
需要模拟完整组织、多角色协作的企业用户
界面特征
- React Flow 拖拽工作流编辑器
- 组织图和团队管理界面
- 讨论/对话界面(多智能体实时交互)
- SSE 驱动的流式实时聊天
四、Multica vs Sutra 对比
| 维度 | Multica | Sutra |
|---|---|---|
| 编排方式 | 任务看板驱动 | 可视化拖拽工作流 |
| 核心隐喻 | 智能体 = 队友 | 智能体 = 组织成员 |
| 技术栈 | Go 后端 + Next.js 前端 | Python FastAPI + Next.js |
| LLM 支持 | 多编码智能体引擎 | 多 LLM 提供商 |
| 主场景 | 编码开发任务 | 通用组织模拟 |
| 自托管 | Docker Compose | Docker Compose + install.sh |
| 社区规模 | 8.6K+ Stars | 较小社区 |
| 商业化 | 有云版本 | 纯开源 |
| 人类在环 | 看板上直接交互 | 审批队列 + 风险控制 |
| 知识管理 | 技能系统复利 | RAG 知识库 + 三层内存 |
五、与我们的业务流程自动化产品的差异分析
我们之前做的事情(BPA/流程AI)
- 核心原则:"Process First" — AI 能力挂载在业务流程节点上
- 具体场景:财务预凭证生成、AI 审批助手、采购流程自动化
- Skill 工程体系:开发→测试→部署,准确率验证、置信度分级、人工确认流
- 强调"AI 兜底推理"和"规则引擎配置"的结合
- 目标:让 AI 在确定的流程链路上做确定的事
关键差异
1. 编排对象不同
- 我们:编排的是"业务流程节点上的 AI 能力"(Skill)
- 他们:编排的是"自主决策的智能体"(Agent)
- 区别:我们的 Skill 是确定性的能力封装,他们的 Agent 是有自主判断的实体
2. 确定性 vs 自主性
- 我们:追求 95%+ 准确率,置信度分级,不确定的交给人
- 他们:接受智能体的不确定输出,通过迭代、重试、多 Agent 讨论来逼近结果
- 核心矛盾:业务流程要求"可靠",智能体编排要求"灵活"
3. 流程驱动 vs 任务驱动
- 我们:沿着端到端业务流程链路,每个节点挂载能力
- Multica:以任务为单位,智能体自主决定执行策略
- Sutra:以组织模拟为隐喻,多角色协商决策
4. 适用场景
- 我们:高确定性业务(财务、审批、采购),错了代价大
- 他们:高探索性任务(编码、设计、研究),试错成本低
5. 与人的关系
- 我们:人是流程的参与者和最终审核者,AI 是执行工具
- Multica:人和智能体是平等的队友
- Sutra:人是管理者,智能体是组织成员
对我们产品设计的启发
可以借鉴的
- 技能复利机制(Multica):我们的 Skill 体系本质上就是这个思路,但可以加强"团队级技能积累"的可视化
- 看板式编排:对于需要多个 Skill 串联的复杂业务,看板可能比固定流程图更灵活
- 多智能体讨论(Sutra):在"AI 审批助手"场景中,多个专家 Agent 讨论审批意见可能有价值
- 人类在环治理(Sutra 的审批队列 + 风险级别):可以增强我们现有的"人工确认流"
需要警惕的
- 不能照搬"智能体自主决策"模式到高确定性业务场景
- "Agent as Teammate" 在 B 端企业落地时,合规和审计是大问题
- 编码场景的成功不代表能迁移到财务/采购等业务场景
产品方向思考
- 短期:保持 Process First,但在"流程节点"内部引入多 Agent 协商(比如审批场景下多个专家 Agent 给出建议)
- 中期:从"固定流程编排"演进到"流程模板 + 智能体灵活执行",在确定的框架下给 Agent 一定自由度
- 长期:看业务场景成熟度,高频稳定场景保持规则驱动,新兴探索场景引入 Agent 自主编排
六、产品链接汇总
| 产品 | 官网 | GitHub | 文档 |
|---|---|---|---|
| Multica | multica.ai | GitHub | Docs |
| Sutra | sutra.gauravdatar.com | GitHub | GitHub README |