学习教程

覆盖基础原理、训练工程、推理优化、RAG 与安全评测。每篇教程都包含目标、原理、实践建议与延伸阅读。

Transformer 注意力机制入门

用最小示例理解 Q/K/V、缩放点积注意力、Multi-Head 的直觉和计算流程。

难度入门 · 45 分钟 · 更新 2026/03/17

Transformer Attention 基础原理

大模型训练流水线总览

从数据清洗、预训练、对齐训练到评测，建立完整训练工程认知框架。

难度进阶 · 70 分钟 · 更新 2026/03/16

训练工程 SFT RLHF

KV Cache 与推理性能优化

理解 KV Cache 如何减少重复计算，并掌握延迟、吞吐、显存之间的权衡。

难度进阶 · 55 分钟 · 更新 2026/03/15

推理优化 KV Cache 系统性能