Zero to Agent · Illustrated Guide

从零图解
解构 AI Agent

这不是一篇“AI 很厉害”的介绍。它把 Agent 拆成可观察、可测试、可落地的工程零件：目标、模型、上下文、工具、记忆、评估、部署。

01 概念 02 拆解图 03 循环 04 工具 05 实战

01 · 先给一句人话

AI Agent 是会循环做事的 AI 系统。

普通聊天机器人回答一句话。Agent 会围绕目标反复执行：理解现状，决定下一步，调用工具，观察结果，修正计划，直到完成或请求人类接管。

Chatbot 输入一句，输出一句。

Workflow 固定步骤，按图执行。

Agent 有目标，会观察，会选择工具，会根据结果改计划。

02 · 拆成七层

不要把 Agent 当黑箱。它是七层工程结构。

看懂这张图，你就能判断一个“Agent 产品”到底只是套壳聊天，还是具备真正做事能力。

7 · Deployment运行环境、权限、密钥、成本、回滚。

6 · Evaluation成功标准、测试集、人工复核、可观测性。

5 · Memory短期状态、长期偏好、项目知识、检索索引。

4 · ToolsMCP、API、浏览器、文件系统、数据库、部署平台。

3 · Context任务、约束、当前文件、历史决策、领域语言。

2 · Model推理、规划、代码生成、判断不确定性。

1 · Goal要完成什么，完成证据是什么。

03 · 核心循环

Agent 的生命体征：Observe → Plan → Act → Verify。

如果没有这个闭环，它只是一次性生成器。闭环越短，Agent 越可靠；证据越强，越适合自动化。

Observe读上下文

Plan拆任务

Act调工具

Verify验结果

04 · 工具调用

工具不是插件列表，是 Agent 的手和眼睛。

模型负责判断，工具负责接触世界。MCP 的价值，是把外部系统统一成 Agent 可发现、可调用、可返回证据的 Interface。

Model

我要知道页面是否部署成功

Tool

curl / browser / Cloudflare Pages

Observation

HTTP 200、截图、日志、部署 ID

Decision

完成，或继续修复

05 · 上下文与记忆

Agent 聪明不聪明，常常取决于给它看什么。

上下文不是越多越好。好上下文像工作台：当前目标放中间，约束在旁边，长期知识可检索，过期信息及时丢掉。

Working Context本轮任务、打开文件、当前错误。

Project Memory领域词汇、ADR、架构 seams。

External Knowledge文档、API、设计稿、数据库。

Human Preference风格、禁忌、验收习惯。

06 · 可靠性

可靠 Agent 不是“不犯错”，而是错误能被发现。

把风险画出来：幻觉、权限过大、上下文污染、工具失败、目标漂移、成本爆炸。每类风险都要有对应的 guardrail 和 eval。

幻觉权限工具失败成本目标漂移上下文污染 Eval

07 · 从零搭一个最小 Agent

最小可用，不是最小聊天框。

按这个顺序做，能避免一上来就陷入 prompt 魔法。

定义目标一句话说明完成状态和证据。
限定工具只给必须工具，先少后多。
设计循环Observe、Plan、Act、Verify，每步可记录。
加测试集正常、边界、失败、恶意输入。
上线观测日志、成本、成功率、人工接管。

08 · 判断清单

看到一个 Agent，问这 8 个问题。

目标是否清晰？完成证据是什么？工具有权限边界吗？上下文来源可靠吗？失败会不会重试或降级？有 eval 吗？人能接管吗？成本可控吗？

summary

一句话收束。

AI Agent = 目标驱动 + 上下文感知 + 工具行动 + 结果验证 + 可持续运行的工程系统。

回到个人页