LeCun曝多模态LLM重大缺陷 提出Interleaved-MoF显著增强视觉理解能力

JS滚动广告
✨ AI前沿 | 每日人工智能最新资讯 ✨

近期,纽约大学和UC伯克利的研究团队在多模态大语言模型领域取得重要突破,成功发现了现有模型在视觉理解方面的重大缺陷。针对这一问题,研究团队提出了「交错特征混合(Interleaved-MoF)」方法,成功提升了多模态大模型的视觉基础能力,并在MMVP基准中获得了10.7%的能力增强。这一研究为未来多模态AI技术的发展提供了有益的启示。

发表评论