时隔6年,ARC-AGI-2正式推出,AI「智商大考」升级

JS滚动广告
✨ AI前沿 | 每日人工智能最新资讯 ✨

突破案例:
DeepSeek-V3在“网格图形重组”题中首次实现80分(创造性突破阈值),但仅占全部测试的5%。
3. 行业评价与意义
François Chollet(ARC创始人):“ARC-AGI-2的目标是暴露AI的‘脆弱泛化’——现有模型在训练数据外的抽象迁移能力仍远落后于人类。”
Meta AI研究员评论:“得分超过75分的模型可能具备初级AGI特征,但目前尚无系统能稳定达到这一水平。”
产业影响:
或推动神经符号混合架构(如DeepMind的AlphaGeometry 2)成为新方向。
科技公司已开始将ARC-AGI-2作为AI招聘测试题(如OpenAI的工程师岗位)。

发表评论