C-Eval评估中文基础模型高级知识和推理能力

JS滚动广告
✨ AI前沿 | 每日人工智能最新资讯 ✨

C-Eval是一项评估中文基础模型高级知识和推理能力的广泛基准。它包括四个难度级别的多项选择题,涵盖52个不同的学科领域。测例库来源于互联网上的模拟考试。C-Eval榜单展示了开源模型在这一评测中的表现。该基准有助于挑选适合自然语言处理领域的大模型,促进AI应用的发展。

发表评论