English mirror

This English page is generated from the current Chinese documentation so every route, anchor, code sample, and language switch stays available on agently.tech. Human-edited English copy can replace this generated body page by page.

从 PoC 到上线

AI Agent 的 PoC 通常很快：一个 prompt、一个模型调用、几段 demo 输出就能展示价值。真正难的是上线：接口要稳定，行动要受控，长流程要能恢复，产物要能复核，版本更新后不能让文档和示例继续掉队。

Agently 的生产路径可以按层验收。

如果还在做系统方案，而不是上线检查，先读企业 Agent 系统设计路线图。那一页按工程骨架、智能回路、外部行动、复杂任务、长程状态和生产治理组织；本页只回答每一层进入生产前要怎么验收。

逐层验收

阶段	目标	验收问题	文档入口
0. 最小原型	跑通模型和业务输入	模型配置是否可复现？失败时是否清楚？	快速开始、模型设置
1. 稳定输出	让结果能被系统消费	字段、类型、必填项、校验和 retry 是否明确？	输出控制
2. 流式体验	让 UI 和服务先看到进展	是否用 instant stream 做临时 UI，并用最终 `get_data()` 写入业务状态？	模型响应
3. 服务化	暴露 HTTP / SSE / WebSocket	接入层是否只做请求校验、调用和返回？是否优先 async？	Async First、FastAPI 服务封装
4. 外部行动	调业务函数、MCP、搜索、浏览或工具	能力 schema、可见范围、日志、错误和审计是否清楚？	Actions 概览
5. 受控环境	托管 MCP server、脚本或沙箱依赖	生命周期、权限、健康检查和失败语义是否明确？	Execution Environment
6. 长流程	处理分支、并发、审批、等待和恢复	execution id、runtime stream、pause/resume、close snapshot 是否能被外部系统使用？	TriggerFlow
7. 多角色协作	让多个专业视角共同处理同一业务任务	角色职责、Sub-Flow、Workspace 拓扑和汇总字段是否明确？	多角色协作与子流程 Playbook
8. 交互层	把过程交给用户、前端或 IM	产品事件、SSE/WebSocket/IM、等待提示和最终状态是否分开？	交互层与主动任务 Playbook
9. 主动任务	定时、webhook、queue 或 worker 推进任务	scheduler、幂等、任务表和 execution 恢复是否有 owner？	交互层与主动任务 Playbook
10. 状态与证据	保留产物、观察、决策和检查点	大块内容是否存 Workspace artifact，执行状态是否只留 ref？	Workspace、长程任务状态与恢复 Playbook
11. 观测与评估	证明系统运行事实和质量变化	是否有 RuntimeEvent、DevTools、评估用例或回放证据？	观测概览、生产治理 Playbook

最小企业拓扑

一个可上线的企业 Agent 服务通常至少拆成这些角色：

模块	负责什么
Gateway / API	认证、租户、请求校验、HTTP/SSE/WebSocket
Agent Core	Agent definition、AgentExecution、Prompt / output contract
Tool Adapters	业务 API、MCP client、本地函数、搜索、浏览
Execution Environment	MCP server、脚本、数据库、浏览器、沙箱等运行依赖
Flow Orchestrator	TriggerFlow definitions、executions、runtime stream、pause/resume
Interaction Layer	产品过程事件、SSE/WebSocket/IM 网关、等待提示和最终通知
Scheduler / Worker	定时触发、webhook、queue、幂等和主动任务推进
Workspace Store	observation、artifact、decision、checkpoint 和 ContextPack
Eval / Observer	RuntimeEvent、DevTools、评估用例、回放和质量判断

不一定一开始就拆成多个仓库或服务，但代码职责应该按这些 owner 分开。否则 PoC 越成功，后面越难交给业务系统长期运行。

上线前检查清单

检查项	通过标准
输出契约	业务系统消费的是结构化 data，不是自然语言片段
流式边界	instant stream 只做临时 UI / 进度状态，最终持久化读最终 data
行动边界	所有可调用能力都在 Actions / MCP / built-in Actions 中注册并有记录
环境边界	脚本、MCP server、浏览器、SQLite、Node.js 等依赖有受控环境 owner
权限与审批	高风险或不可回滚动作有 policy、审批或 fail-closed 路径
长流程	需要等待、恢复或人工介入的流程有 execution handle 和 interrupt 语义
多角色协作	角色化 Agent、Sub-Flow、Workspace 拓扑和结构化汇总字段清楚
交互层	UI/IM 消费的是产品事件，不是 parser path、chunk 名或 RuntimeEvent
主动任务	scheduler / webhook / queue 与 HTTP request handler 分离，任务推进有幂等键
状态	大块产物、下载物、报告和日志不塞进 prompt 或 execution state
恢复	checkpoint、execution save/load、runtime resource 重新注入和外部 resume 入口清楚
观测	请求、Action、Execution Environment、TriggerFlow 关键事件可追踪
回归	有代表性输入、输出契约检查、业务规则校验或模型 judge 评估
治理	成本、timeout、重试、幂等、安全和审计各有 owner
更新	release / docs / examples / Agently-Skills 指引能同步更新

何时可以先不做

能力	可以暂缓的条件
TriggerFlow	只有一次请求，没有分支、并发、等待、恢复或过程流
多角色协作	一个 AgentExecution 已经能完成稳定结构化结果
主动任务	任务只由用户请求即时触发，不需要定时、webhook 或 worker 推进
Dynamic Task	任务图不是模型或业务系统提交的数据
Workspace	没有跨轮证据、产物、检查点和长期上下文
Execution Environment	只调用普通本地函数或已托管的业务 API
DevTools / Eval	PoC 初期可以先用日志和人工审查，但上线前必须补运行证据

生产路径不是一次性把所有能力打开。更好的做法是：每新增一层能力，就补一层可验证证据。

Playbook 入口

任务会跨轮、等待审批、恢复或复核产物：长程任务状态与恢复 Playbook
一个任务需要多个专业角色协作：多角色协作与子流程 Playbook
过程要推给前端/IM，或系统要主动触发任务：交互层与主动任务 Playbook
准备上线、发布前回归、接日志和审计：生产治理 Playbook

从 PoC 到上线 ​

逐层验收 ​

最小企业拓扑 ​

上线前检查清单 ​