C-Eval评估中文基础模型高级知识和推理能力

6 月 06, 2025 AI前沿

20 0

JS滚动广告

✨ AI前沿 | 每日人工智能最新资讯 ✨

C-Eval是一项评估中文基础模型高级知识和推理能力的广泛基准。它包括四个难度级别的多项选择题，涵盖52个不同的学科领域。测例库来源于互联网上的模拟考试。C-Eval榜单展示了开源模型在这一评测中的表现。该基准有助于挑选适合自然语言处理领域的大模型，促进AI应用的发展。

导航菜单