字节跳动与浙江大学联合推出多模态大语言模型Vista-LLaMA,实现视频内容深度理解

JS滚动广告
✨ AI前沿 | 每日人工智能最新资讯 ✨

字节跳动与浙江大学合作的Vista-LLaMA多模态大语言模型为视频内容理解和生成领域带来新的解决框架。通过独特处理方式,该模型避免了在长视频中出现的“幻觉”现象,表现卓越在多个基准测试中。推出的CineClipQA新数据集进一步提升了多模态语言模型的训练和测试资源。

发表评论