⌘Ctrlk

GitBook 助手

工作中...思考中...

晚上好

我在这里帮助您了解文档。

⌘Ctrli

AI 基于您的上下文

首页
数学字典
技术笔记
代码实现
Notebook 与 HTML
模拟面试
学习路线
评测与复盘
测试

由 GitBook 提供支持

在本页

技术笔记

RL 基础设施

这部分关注 RL 训练和推理系统的工程实现，而不是只讲算法公式。

RL 训练 / 推理全链路优化
Multi-LoRA 联合训练
GPU 优化与瓶颈定位
Slime 框架深度拆解
实战 Demo 清单与试错日志

上一页训练与对齐下一页代码 / 算法速查

最后更新于13天前