架构 入门 2017 Transformer 系列 Attention Is All You Need 论文解读 Transformer 架构的开创性论文,彻底改变了 NLP 领域并奠定了现代大模型的基础 Transformer注意力机制序列建模 +1 2026年3月1日