数学字典

用来在最短时间内定位公式、变量定义、张量形状和量级估算。这个目录现在按 GitBook 连续阅读习惯重新整理,建议优先配合 SUMMARY.mdarrow-up-right 使用。

这部分适合什么时候看

  • 面试前 15 分钟:先看符号表、张量形状、KV 显存、服务指标。

  • 系统学习前:先统一符号和量纲,再进入长文笔记。

  • 写代码前:先把张量形状和复杂度过一遍,避免实现时维度混乱。

  • 做性能分析时:直接查 Prefill / Decode、Roofline、SLO、队列模型。

先看这 6 页

  1. symbols-glossary.md:统一符号和单位。

  2. tensor-shapes.md:Q / K / V、GQA、MoE 的形状速查。

  3. transformer-attention-math.md:Attention、RoPE、Norm、FFN 的核心公式。

  4. flashattention-math.md:在线 Softmax 与 IO 优化的详细推导。

  5. kv-memory.md:KV Cache 显存估算与容量规划。

  6. serving-metrics.md:TTFT、TPOT、吞吐、P99、Goodput。

按主题阅读

Transformer 核心

KV Cache 与推理性能

服务与系统

训练与对齐

?????????

GitBook 友好写法约定

  • 显示公式优先使用独立的 $$ ... $$ 块,避免把长公式塞进表格。

  • 在表格里出现绝对值、范数、KL 时,优先写成 \lvert x \rvert\lVert x \rVert\parallel

  • 若某一页需要同时讲公式和实现,优先补一节“对应源码”,并从本目录回链过去。

最后更新于