技术笔记

这里是知识库的正文主体,面向“理解为什么这样设计”。如果数学字典解决的是“公式是什么”,这里解决的是“工程上为什么这么做、代价在哪里、替代方案是什么”。

建议阅读顺序

目标
建议起点
接下来读什么

先把推理主线跑通

KV Cache -> Inference -> Serving

先补系统设计

Distributed -> Frameworks -> Serving

先补训练与对齐

RL Infra -> Frontier

先看公式到实现

再对照 src/attention/*.py

核心专题

基础与核心机制

推理系统

训练与前沿

其他专题

公式深挖与源码对照

GitBook 阅读建议

最后更新于