覆盖预训练、数据工程、PEFT、后训练和 RLHF 的完整链路。
预训练数据工程arrow-up-right
预训练实战全流程arrow-up-right
Scaling Lawarrow-up-right
PEFT 方法全景对比arrow-up-right
指令数据构建arrow-up-right
微调框架实战arrow-up-right
LoRA + RLHFarrow-up-right
对齐训练全流程arrow-up-right
后训练高级技术arrow-up-right
RM 训练 + RLHF 实战arrow-up-right
最后更新于13天前