北邮、南洋理工推沙雕视频数据集 FunQA 用算法学习喜剧
北京邮电大学、南洋理工大学及艾伦人工智能研究所推出了名为 FunQA 的高质量视频问答数据集,用于测试和提高 AI 模型对反直觉视频内容的理解能力。该数据集包含 4365 个反直觉视频和 312 万个文本问答,涵盖幽默、创意和魔术等领域。FunQA 通过设计时间戳定位、详细描述、反直觉推理等任务,对模型的理解能力提出深入挑战。研究者表示,当前模型在 FunQA 任务上的表现不佳,需要进一步提升模型的大小、数据质量和训练策略。该数据集的发布有望推动计算机视觉研究的发展。
发表评论