Skip to content

从零构建 AI Coding Agent

选起步路线,边学边做,建立 Agent 工程直觉

Start Here

30 秒选一条适合你的起步路线

你不需要先读完整目录。先选最符合当前状态的入口,站内路线会继续把你带到实践篇和中级专题。

先看源码理论篇

先看懂 Agent 主链路

先建立统一概念框架,再逐步进入工具、会话和实践闭环。

适合想先把 Agent 主链路、工具系统和会话循环串起来,再带着结构感进入项目。

适合:已经会调模型,但还没把 Agent 工程结构看清楚的开发者
1. 起步锚点什么是 Agent
2. 下一步去哪核心组件
先做项目实践篇

先跑通第一个可运行 Agent

30 秒内找到能直接开练的入口,边做边补理论。

适合已经会调模型、想先抄一个最小可运行 Agent,再回头补理论的人。

适合:更偏项目驱动、希望直接抄作业和照着搭的开发者
1. 起步锚点P1 最小 Agent
2. 下一步去哪什么是 Agent
先补工程判断中级篇

从最小闭环走到工程判断

聚焦那些决定 Agent 是否可维护、可协作、可扩展的核心章节。

适合已经做过简单 Demo,想快速补齐 Planning、上下文工程和系统边界意识。

适合:已经做过简单 Demo,想补齐工程判断与架构视角的开发者
1. 起步锚点核心组件
2. 下一步去哪工具系统

Runtime lifecycle

全书统一运行时主链路

后续 15 篇其实都在拆这条链路的不同片段。先把总图记住,再进入各章细节。

  1. Prompt 输入

    prompt

    用户提出任务,系统先把输入整理成可消费的消息。

    入口通常从 CLI、TUI 或 HTTP 请求开始,先决定本轮任务到底要解决什么。

  2. Agent / Session

    session

    会话装配 Agent、权限、系统提示词和当前上下文。

    这里决定角色、模式、消息历史和是否需要继续恢复已有状态。

  3. Tool dispatch

    tools

    模型拿到可用工具后,进入工具调用与结果回写循环。

    工具不是附属物,而是运行时主链路里最容易扩张成本和风险的边界。

  4. Provider / Model

    provider

    Provider 抽象把具体模型接进统一的流式执行接口。

    这里处理模型解析、认证、参数绑定和多提供商差异。

  5. File / Terminal / LSP

    side-effects

    真正改变系统状态的地方发生在文件、终端和代码智能能力上。

    这是工程边界,不是文案边界;一旦进入这里,就需要权限和恢复机制兜底。

  6. Result / UI feedback

    feedback

    结果被写回消息流,再反馈到 CLI、TUI、Web 或桌面界面。

    这一步决定用户看到的是最终答案、流式事件,还是下一轮可恢复的状态。