训练 进阶 2025 DeepSeek 系列 DeepSeek-R1 论文解读 通过强化学习激发大语言模型推理能力的突破性工作,开创了推理模型的新范式 强化学习推理能力GRPO +2 2026年3月10日
架构 入门 2017 Transformer 系列 Attention Is All You Need 论文解读 Transformer 架构的开创性论文,彻底改变了 NLP 领域并奠定了现代大模型的基础 Transformer注意力机制序列建模 +1 2026年3月1日