MMLU

专题聚合页：打通教程、路径、模拟器与论文，快速构建完整知识链路。

教程 (0)

暂无教程

后续会补充该方向的系统教程。

学习路径 (0)

暂无学习路径

后续会补充该方向的阶段化学习路线。

可视化模拟 (0)

暂无模拟器

后续会补充该方向的交互式仿真内容。

论文 (1)

LLM 评测方法论：从 MMLU 到 MT-Bench

把知识问答、代码能力、对话质量和 LLM-as-a-Judge 放到同一张图里，帮助读者理解“模型更强”到底应该怎样被验证。

2023 · arXiv

评测 MMLU HumanEval MT-Bench