词嵌入与 Tokenizer 原理 从分词、词表、BPE 到 embedding 查表与位置对齐,建立“文本如何变成模型可计算向量”的完整直觉。 难度 入门 · 更新 2026/03/24 Tokenizer Embedding 基础原理 预训练