Meta 发布全新 AI 模型 SeamlessM4T,可转录和翻译近百种语言
IT之家 8 月 22 日消息,Facebook 的母公司 Meta Platforms 今日发布了一种能够翻译和转录数十种语言的人工智能模型 ——SeamlessM4T,可以让说不同语言的人更有效地进行交流,为开发人类通用语言翻译器提供了助力。
Meta 声称,SeamlessM4T 将与新的翻译数据集 SeamlessAlign 一同开源,它代表了人工智能驱动的“语音到语音”和“语音到文本”领域的“重大突破”。
Meta 表示,该模型可以在近 100 种语言之间进行文本到语音的翻译,并支持 35 种语言的完全语音到语音翻译,而此前要想实现类似的操作只能在单独的 AI 模型中分别进行翻译。SeamlessM4T 支持:
(资料图片)
1、近 100 种语言的语音识别。
2、近 100 种输入和输出语言的语音到文本翻译。
3、支持近 100 种输入语言和 36 种输出语言的语音到语音翻译。
4、支持近 100 种语言的文本到文本翻译。
5、支持近 100 种输入语言和 35 种输出语言的文本到语音翻译。
目前,Meta 将以研究许可证的形式向公众免费提供该模型(仅限非商业用途),以便研究人员和开发人员在此基础上开展工作。
据介绍,Meta 还将发布 SeamlessAlign 元数据,这是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达 270000 小时。
马克・扎克伯格表示,他坚信这些工具将促进来自全球各地的用户在元宇宙中的互动,这也是他对该公司未来的赌注所在。
他还表示,开放 AI 生态系统对 Meta 有利,因为该公司通过有效地将创建面向消费者的工具的任务众包来获得更多收益,而不是通过访问模型来收费。
据称,Meta 后续还将把这些翻译和转录方面的 AI 进展整合到 Facebook、Instagram、WhatsApp、Messenger 和 Threads 中。
关于 SeamlessM4T 模型,Meta 研究人员在一份研究论文中表示,他们从“爬取的网页数据的公开可用存储库中”收集了 400 万小时的“原始音频”,但IT之家没有找到具体是哪个存储库的说明,官方只提到文本数据来自去年创建的数据集,而该数据集来自于维基百科及相关网站提取的内容。
关键词:
您可能也感兴趣:
为您推荐
2023年中国网络视听精品创作峰会在青岛开幕
中国邮政储蓄银行江苏省分行:构建金融助力江苏现代产业高效体系
爱情哲理句子经典3篇
排行
最近更新
- Meta 发布全新 AI 模型 SeamlessM4T,可转录和翻译近百种...
- 河南安阳:“内黄民声”监督服务微信群的实践探索
- 亚运会纪念邮票来了!长啥样
- 奇趣宝典俱乐部第二季(奇趣宝典俱乐部)
- 龙临异世百度百科(龙临异世)
- 江苏农村信用合作社电话客服 江苏农村信用合作社
- 阿尔卡拉斯卫冕美网不是梦
- 菲亚娜·蕾·奥尔德西亚(关于菲亚娜·蕾·奥尔德西亚简述)
- 海参崴旅游攻略及费用(海参崴旅游)
- excel按序排列操作(excel按顺序排列)
- 3-1,晋级!迈阿密决赛对手诞生,梅西梦幻4天,C罗网红迷弟发声
- administrator账户被停用打不开咋办
- 已经完全从重伤中康复了,勇士内线新援将完美融入球队中?
- 九部门联合发文,引导退休干部回乡定居,其实有个问题一定得考虑
- 广和通(300638.SZ):拟斥0.5亿元-1.0亿元回购公司股份
- 创新赋能未来|“前瞻·进取·思想汇”在京圆满举办
- win7如何查ip地址(如何查ip地址)
- 力合科创:8月23日召开董事会会议
- 仁信新材:8月24日召开董事会会议
- 籍田街道七彩文体生活——“七彩暑期·童心飞扬”公益活动结...
- 长眠盐城阜宁75年,宿迁籍烈士等来亲人
- 总投资3.865亿,咸宁一路段9月底完工并通车
- 各地密集部署,敲定经济“任务表”
- 住宅限价19000元/㎡,长沙观沙岭挂牌一宗商住地
- 2023上半年度西部大开发地区前十强城市GDP排名榜单
- 常德市二医院健康科普:了解艾灸,帮助我们更好地调养身体
- 阿里巴巴国际站发布全链路外贸AI产品
- 中国人寿:持有远洋集团股份属财务投资 对总体投资资产影响可控
- 新车买半年,送修十几次 4S店承诺,将为车辆进行一次全面细...
- 央企布局战略性新兴产业支持政策有望出台