LLM-REVIEW
search
⌘Ctrlk
GitBook Assistant
GitBook 助手
工作中...思考中...
GitBook Assistant
晚上好

我在这里帮助您了解文档。

⌘Ctrli
AI 基于您的上下文question-circle
LLM-REVIEW
  • 首页
  • 数学字典
  • 技术笔记
    • 基础知识
    • 架构综述
    • 注意力机制
    • KV Cache
    • KV 压缩
    • KV 驱逐
    • 推理与解码
    • 分布式系统
    • 推理框架
    • 服务与成本
    • LLM 系统设计
    • CUDA 与性能
    • 调试与排障
    • 评测与分析
    • 多模态
    • 训练与对齐
    • RL 基础设施
    • 代码 / 算法速查
    • Source Reading
    • System Design
    • Tools
    • 前沿追踪
    • 复现与复盘
    • Nano Projects
  • 代码实现
  • Notebook 与 HTML
  • 模拟面试
  • 学习路线
  • 评测与复盘
  • 测试
gitbook由 GitBook 提供支持
block-quote在本页chevron-down
  1. 技术笔记

训练与对齐

覆盖预训练、数据工程、PEFT、后训练和 RLHF 的完整链路。

  • 预训练数据工程arrow-up-right

  • 预训练实战全流程arrow-up-right

  • Scaling Lawarrow-up-right

  • PEFT 方法全景对比arrow-up-right

  • 指令数据构建arrow-up-right

  • 微调框架实战arrow-up-right

  • LoRA + RLHFarrow-up-right

  • 对齐训练全流程arrow-up-right

  • 后训练高级技术arrow-up-right

  • RM 训练 + RLHF 实战arrow-up-right

上一页多模态chevron-left下一页RL 基础设施chevron-right

最后更新于13天前