大模型与 Agent 工程学习路线¶

这里放已经整理成学习材料的内容。

这条路线不是资料堆放，而是从模型底层一路走到 Agent 产品设计：

全局地图
  ↓
LLM 生命周期
  ↓
数据、Tokenizer 与预训练数据工程
  ↓
后训练与对齐
  ↓
Reasoning Models / Test-Time Compute
  ↓
Transformer
  ↓
LLM 推理优化
  ↓
LLM API：HTTP 请求如何变成 Transformer 输入
  ↓
LLM 应用架构：Chatbot / RAG / 工具调用 / Workflow / Agent
  ↓
模型训练、微调和部署
  ↓
Agent 开发与评测
  ↓
Harness Engineering / Agent 安全与 Guardrails / Loop Engineering
  ↓
Agent 上下文工程
  ↓
Multi-Agent 与大型 Agent 系统
  ↓
开源 Agent 提示词目录

建议阅读顺序¶

遇到术语先查：核心概念索引
先读：从 LLM 出生到大型 Agent 系统
再读：LLM 生命周期：从数据到线上模型
展开数据地基：数据、Tokenizer 与预训练数据工程入门
继续读：后训练与对齐入门：SFT、DPO、RLHF、RFT
继续读：Reasoning Models 与 Test-Time Compute 入门
继续读：Transformer 入门
继续读：LLM 推理与架构优化入门
然后读：LLM API：从 HTTP 到 Transformer
接着读：LLM 应用架构：Chatbot、RAG、工具调用、工作流与 Agent
继续读：模型训练与部署学习路线
选择实操方向：原生 Python 训练循环入门、LoRA 与 QLoRA 微调入门、本地部署框架对比
想理解显存为什么能降下来，读：模型量化与推理压缩入门
需要买卡或上服务器时读：模型部署硬件选型
遇到参数再查：参数调优手册
开始做 Agent：Agent 开发入门
选择模式：Agent 模式与实现
读 Agent 产品化工程：Harness Engineering
补上安全边界：Agent 安全与 Guardrails
读 Agent 循环控制：Loop Engineering
进入多 Agent 架构：Multi-Agent 协作、自进化与记忆系统
继续看平台级设计：大型 Agent 系统架构设计
设计可复用能力：Agent Skills 实现思路
做质量闭环：Agent 效果评测框架
再读：上下文工程入门
继续读：什么是上下文工程
需要模板时查：上下文工程提示词模板库
最后查：开源 Agent 提示词目录

建议先理解模型如何处理文本、推理为什么有成本，再理解 API 如何调用模型，然后进入训练、部署和 Agent 上下文工程。源码目录是进阶资料，不建议第一遍直接看。

你现在应该读哪篇¶

如果你遇到陌生词，先查核心概念索引。如果你不知道整套文档怎么串起来，先读从 LLM 出生到大型 Agent 系统。

如果你想理解 LLM 怎么从数据变成线上模型，读 LLM 生命周期：从数据到线上模型。

如果你想理解原始网页、代码、论文如何变成 token 序列和预训练样本，读数据、Tokenizer 与预训练数据工程入门。

如果你想理解 base model 为什么会变成 chat model、tool-use model 或 reasoning model，读后训练与对齐入门：SFT、DPO、RLHF、RFT。

如果你想理解 reasoning effort、thinking budget、reasoning tokens 和 Agent loop 成本，读 Reasoning Models 与 Test-Time Compute 入门。

如果你不知道模型内部怎么处理文字，读 Transformer 入门。

如果你已经知道 attention，但不知道为什么推理服务要谈 KV Cache、batching、MoE，读 LLM 推理与架构优化入门。

如果你想知道一次 HTTP 请求如何变成模型输入，读 LLM API：从 HTTP 到 Transformer。

如果你想知道有了 API 后应用怎么搭，读 LLM 应用架构：Chatbot、RAG、工具调用、工作流与 Agent。

如果你想训练或部署自己的模型，先读模型训练与部署学习路线，再选择训练或部署专题。看不懂 INT4、AWQ、GPTQ、GGUF 时，读模型量化与推理压缩入门。需要判断 32B、70B、671B 要什么机器时，读模型部署硬件选型。

如果你要开发 Agent，读 Agent 开发入门，再读 Agent 模式与实现。想理解同一个模型为什么放进不同 Agent 产品效果不同，读 Harness Engineering。只要 Agent 能调用工具、读文件、联网或写数据，就要读 Agent 安全与 Guardrails。想解决循环、重试、停止和恢复，读 Loop Engineering。如果要做多 Agent、A2A、自进化和记忆系统，读 Multi-Agent 协作、自进化与记忆系统。如果要做平台级架构，读大型 Agent 系统架构设计。

如果你想做 Codex、Claude Code 这类 Agent 产品，读上下文工程入门和什么是上下文工程。

大模型与 Agent 工程学习路线¶

建议阅读顺序¶

你现在应该读哪篇¶

机器学习基础¶

API、训练与部署¶

Agent 与上下文工程¶