Skip to content

English mirror

This English page is generated from the current Chinese documentation so every route, anchor, code sample, and language switch stays available on agently.tech. Human-edited English copy can replace this generated body page by page.

Read the Chinese source page

从 PoC 到上线

AI Agent 的 PoC 通常很快:一个 prompt、一个模型调用、几段 demo 输出就能展示价值。真正难的是上线:接口要稳定,行动要受控,长流程要能恢复,产物要能复核,版本更新后不能让文档和示例继续掉队。

Agently 的生产路径可以按层验收。

如果还在做系统方案,而不是上线检查,先读 企业 Agent 系统设计路线图。那一页按工程骨架、智能回路、外部行动、复杂任务、长程状态和生产治理组织;本页只回答每一层进入生产前要怎么验收。

逐层验收

阶段目标验收问题文档入口
0. 最小原型跑通模型和业务输入模型配置是否可复现?失败时是否清楚?快速开始模型设置
1. 稳定输出让结果能被系统消费字段、类型、必填项、校验和 retry 是否明确?输出控制
2. 流式体验让 UI 和服务先看到进展是否用 instant stream 做临时 UI,并用最终 get_data() 写入业务状态?模型响应
3. 服务化暴露 HTTP / SSE / WebSocket接入层是否只做请求校验、调用和返回?是否优先 async?Async FirstFastAPI 服务封装
4. 外部行动调业务函数、MCP、搜索、浏览或工具能力 schema、可见范围、日志、错误和审计是否清楚?Actions 概览
5. 受控环境托管 MCP server、脚本或沙箱依赖生命周期、权限、健康检查和失败语义是否明确?Execution Environment
6. 长流程处理分支、并发、审批、等待和恢复execution id、runtime stream、pause/resume、close snapshot 是否能被外部系统使用?TriggerFlow
7. 多角色协作让多个专业视角共同处理同一业务任务角色职责、Sub-Flow、Workspace 拓扑和汇总字段是否明确?多角色协作与子流程 Playbook
8. 交互层把过程交给用户、前端或 IM产品事件、SSE/WebSocket/IM、等待提示和最终状态是否分开?交互层与主动任务 Playbook
9. 主动任务定时、webhook、queue 或 worker 推进任务scheduler、幂等、任务表和 execution 恢复是否有 owner?交互层与主动任务 Playbook
10. 状态与证据保留产物、观察、决策和检查点大块内容是否存 Workspace artifact,执行状态是否只留 ref?Workspace长程任务状态与恢复 Playbook
11. 观测与评估证明系统运行事实和质量变化是否有 RuntimeEvent、DevTools、评估用例或回放证据?观测概览生产治理 Playbook

最小企业拓扑

一个可上线的企业 Agent 服务通常至少拆成这些角色:

模块负责什么
Gateway / API认证、租户、请求校验、HTTP/SSE/WebSocket
Agent CoreAgent definition、AgentExecution、Prompt / output contract
Tool Adapters业务 API、MCP client、本地函数、搜索、浏览
Execution EnvironmentMCP server、脚本、数据库、浏览器、沙箱等运行依赖
Flow OrchestratorTriggerFlow definitions、executions、runtime stream、pause/resume
Interaction Layer产品过程事件、SSE/WebSocket/IM 网关、等待提示和最终通知
Scheduler / Worker定时触发、webhook、queue、幂等和主动任务推进
Workspace Storeobservation、artifact、decision、checkpoint 和 ContextPack
Eval / ObserverRuntimeEvent、DevTools、评估用例、回放和质量判断

不一定一开始就拆成多个仓库或服务,但代码职责应该按这些 owner 分开。否则 PoC 越成功,后面越难交给业务系统长期运行。

上线前检查清单

检查项通过标准
输出契约业务系统消费的是结构化 data,不是自然语言片段
流式边界instant stream 只做临时 UI / 进度状态,最终持久化读最终 data
行动边界所有可调用能力都在 Actions / MCP / built-in Actions 中注册并有记录
环境边界脚本、MCP server、浏览器、SQLite、Node.js 等依赖有受控环境 owner
权限与审批高风险或不可回滚动作有 policy、审批或 fail-closed 路径
长流程需要等待、恢复或人工介入的流程有 execution handle 和 interrupt 语义
多角色协作角色化 Agent、Sub-Flow、Workspace 拓扑和结构化汇总字段清楚
交互层UI/IM 消费的是产品事件,不是 parser path、chunk 名或 RuntimeEvent
主动任务scheduler / webhook / queue 与 HTTP request handler 分离,任务推进有幂等键
状态大块产物、下载物、报告和日志不塞进 prompt 或 execution state
恢复checkpoint、execution save/load、runtime resource 重新注入和外部 resume 入口清楚
观测请求、Action、Execution Environment、TriggerFlow 关键事件可追踪
回归有代表性输入、输出契约检查、业务规则校验或模型 judge 评估
治理成本、timeout、重试、幂等、安全和审计各有 owner
更新release / docs / examples / Agently-Skills 指引能同步更新

何时可以先不做

能力可以暂缓的条件
TriggerFlow只有一次请求,没有分支、并发、等待、恢复或过程流
多角色协作一个 AgentExecution 已经能完成稳定结构化结果
主动任务任务只由用户请求即时触发,不需要定时、webhook 或 worker 推进
Dynamic Task任务图不是模型或业务系统提交的数据
Workspace没有跨轮证据、产物、检查点和长期上下文
Execution Environment只调用普通本地函数或已托管的业务 API
DevTools / EvalPoC 初期可以先用日志和人工审查,但上线前必须补运行证据

生产路径不是一次性把所有能力打开。更好的做法是:每新增一层能力,就补一层可验证证据。

Playbook 入口