Meta发布多语言语音翻译模型SeamlessM4T:可翻译多达100种语言、语音或文本
Meta发布了一种名为SeamlessM4T的多模态人工智能模型,支持最多100种语言的语音和文本翻译。该模型能够执行语音识别、语音到文本翻译、语音到语音翻译、文本到文本翻译和文本到语音翻译等功能。SeamlessM4T是一个单一的人工智能模型,而不是多个模型组合在一条链上,减少了错误,增加了翻译的效率。Meta的研究人员创建了一个多模式语料库SeamlessAlign,其中含有自动对齐的超过470,000个小时的语音翻译,可以用于训练未来的翻译人工智能模型。
发表评论