大模型训练流水线总览 从数据准备、预训练、指令微调、偏好对齐到评测上线,建立一条完整、可落地的大模型训练工程地图。 难度 进阶 · 更新 2026/03/24 训练工程 预训练 SFT RLHF DPO
SFT 数据构造与质量控制 从任务定义、样本模板、数据清洗、多样性设计到评测回流,建立一套可落地的指令微调数据工程方法。 难度 进阶 · 更新 2026/03/24 SFT 数据工程 训练工程 指令数据