Context Engineering

语言：English · 中文

模型只看得见上下文窗口里的内容。Context engineering 就是决定「放什么、放哪、不放什么」的纪律。

上下文从哪来

按职责选槽：

不要全往 input 塞。也不要把每次都变的 payload 写进 info。

你有的内容	放进
agent 的人设、语气、能力规则	`role`（`always=True`）
模型必须知道的固定枚举（如严重度代码）	`info`（`always=True`）
一类任务的步骤指令	`instruct`（`always=True` 当 agent 只做这类任务）
一次调用的可变 payload	`input`
上几轮对话	session chat history
100k tokens 公司文档	KB + 检索，不放进 prompt
当前轮检索到的相关事实	仅本次请求的 `info`

info 接受 dict，框架渲染。这比手工把 JSON 拼进 prompt 好 —— diff 可读，框架可一致地渲染成 YAML / JSON / 伪表格。

python

agent.info({
    "severities": ["P0", "P1", "P2", "P3"],
    "format": "用 markdown bullet，无开场白。",
}, always=True)

用了 actions / tools 后，框架会在模型规划工具调用时自动注入工具目录。不要手工把工具描述抄进 info。详见 Action Runtime。

场景	最合适的位置
「记住用户在这次对话里报的姓名」	session chat history
「跨多次对话记住用户偏好」	自定义 session resize / memo，或应用层用户画像
「从知识库里查到相关片段」	KB 检索 → 把片段放进单次 `info`
「模型每次都要看的固定列表」	`info(always=True)`
「用户刚发了 500 字的问题」	`input`

上下文窗口快满时：

默认 session 只按 session.max_length 做窗口裁剪；需要摘要时，注册自定义 resize handler，把摘要写入 session memo。详见会话记忆。
一次性长输入，先摘要再请求，不要中间截断。

python

result = (
    agent
    .info({"retrieved_snippets": chunks}, always=False)  # 仅本次
    .input(question)
    .output({...})
    .start()
)

不传 always=True，info 仅本次有效。