⌘Ctrlk

GitBook 助手

工作中...思考中...

晚上好

我在这里帮助您了解文档。

⌘Ctrli

AI 基于您的上下文

首页
数学字典
技术笔记
代码实现
Notebook 与 HTML
模拟面试
学习路线
评测与复盘
测试

由 GitBook 提供支持

在本页

技术笔记

架构综述

关注主流大模型在注意力、MoE、位置编码和混合架构上的设计差异。

Transformer 核心组件
位置编码方案对比
LLaMA 3 架构分析
DeepSeek-V3 架构拆解
Mixtral MoE 架构
MoE 训练策略
SSM 混合架构

上一页基础知识下一页注意力机制

最后更新于13天前