C-Eval评估中文基础模型高级知识和推理能力
C-Eval是一项评估中文基础模型高级知识和推理能力的广泛基准。它包括四个难度级别的多项选择题,涵盖52个不同的学科领域。测例库来源于互联网上的模拟考试。C-Eval榜单展示了开源模型在这一评测中的表现。该基准有助于挑选适合自然语言处理领域的大模型,促进AI应用的发展。
C-Eval是一项评估中文基础模型高级知识和推理能力的广泛基准。它包括四个难度级别的多项选择题,涵盖52个不同的学科领域。测例库来源于互联网上的模拟考试。C-Eval榜单展示了开源模型在这一评测中的表现。该基准有助于挑选适合自然语言处理领域的大模型,促进AI应用的发展。
发表评论