Meta 发布 SeamlessM4T AI 模型,可翻译和转录近百种语言
SeamlessM4T支持近100种语言的自动语音识别、语音到文本翻译、语音到语音翻译、文本到文本翻译和文本到语音翻译的多任务支持。
他们的目标是建立一个通用语言翻译器,就像《银河系漫游指南》中的虚构的巴别鱼一样。\\ud83d\\udca1
SeamlessM4T支持:
•近100种语言的自动语音识别
•近100种输入和输出语言的语音到文本翻译
•语音到语音翻译,支持近100种输入语言和35种(+英语)输出语言
•近100种语言的文本到文本翻译
•文本到语音翻译,支持近100种输入语言和35种(+英语)输出语言
Meta 表示,它将以研究许可证的形式公开发布 SeamlessM4T,以便研究人员和开发人员在此基础上开展工作。此外,Meta 还发布了 SeamlessAlign 的元数据,这是迄今为止最大的开放式多模态翻译数据集之一,共挖掘了 27 万小时的语音和文本对齐。
该模型采用了多任务UnitY模型架构,能够直接生成翻译后的文本和语音。
SeamlessM4T模型的开发是为了实现一个通用的语言翻译器,能够覆盖世界上的大部分语言。
详细:https://t.co/yLYCjVP3Fd
在线演示:https://t.co/vlyDzxJjmA
Hugging Face 演示:https://t.co/YFBdoPWBBn