跳转至
大模型与 Agent 工程学习路线
决策记录
正在初始化搜索引擎
大模型与 Agent 工程学习路线
首页
核心概念索引
从 LLM 出生到大型 Agent 系统
LLM 生命周期:从数据到线上模型
数据、Tokenizer 与预训练数据工程入门
后训练与对齐入门:SFT、DPO、RLHF、RFT
Reasoning Models 与 Test-Time Compute 入门
Transformer 入门
LLM 推理与架构优化入门
LLM API:从 HTTP 到 Transformer
LLM 应用架构:Chatbot、RAG、工具调用、工作流与 Agent
模型训练与部署学习路线
原生 Python 训练循环入门
LoRA 与 QLoRA 微调入门
本地部署框架对比
模型量化与推理压缩入门
模型部署硬件选型
参数调优手册
Agent 开发入门
Agent 模式与实现
Harness Engineering
Agent 安全与 Guardrails
Loop Engineering
Multi-Agent 协作、自进化与记忆系统
大型 Agent 系统架构设计
Agent Skills 实现思路
Agent 效果评测框架
上下文工程入门
什么是上下文工程
上下文工程提示词模板库
开源 Agent 提示词目录
决策记录
决策记录
目录
2026-06-20
目录
2026-06-20
决策记录
¶
这里记录已经做出的重要决定,方便之后回看。
2026-06-20
¶
使用 MkDocs 记录学习过程中的重要内容。
保持文档内容干净,不预设具体主题方向。
回到页面顶部