Hugging Face 推开源多模态 AI 模型 IDEFICS 支持图像、文本输入
Hugging Face 推出了名为 IDEFICS 的开源多模态 AI 模型,可以接受图像和文本作为输入,并生成连贯的文本输出。IDEFICS 基于 DeepMind 的 Flamingo 视觉语言模型开发,具有 800 亿的参数量。模型有 90 亿和 800 亿参数版本,支持生成连贯的文本。该模型的推出为研究人员和开发者提供了一个强大的开源视觉语言模型,显示出生成式模型处理多模态输入的潜力,有望推动多模态 AI 应用的发展。
发表评论