字节跳动与浙江大学联合推出多模态大语言模型Vista-LLaMA，实现视频内容深度理解 - AI前沿

首页 > AI技术

字节跳动与浙江大学联合推出多模态大语言模型Vista-LLaMA，实现视频内容深度理解

6 月 06, 2025 AI前沿

23 0

JS滚动广告

✨ AI前沿 | 每日人工智能最新资讯 ✨

字节跳动与浙江大学合作的Vista-LLaMA多模态大语言模型为视频内容理解和生成领域带来新的解决框架。通过独特处理方式，该模型避免了在长视频中出现的“幻觉”现象，表现卓越在多个基准测试中。推出的CineClipQA新数据集进一步提升了多模态语言模型的训练和测试资源。

Vista-LLaMA 多模态大语言模型视频内容理解

发表评论

取消回复