Meta 发布全新 AI 模型 SeamlessM4T,可转录和翻译近百种语言
时间:2023-08-23 10:28:30来源:IT之家

IT之家 8 月 22 日消息,Facebook 的母公司 Meta Platforms 今日发布了一种能够翻译和转录数十种语言的人工智能模型 ——SeamlessM4T,可以让说不同语言的人更有效地进行交流,为开发人类通用语言翻译器提供了助力。

Meta 声称,SeamlessM4T 将与新的翻译数据集 SeamlessAlign 一同开源,它代表了人工智能驱动的“语音到语音”和“语音到文本”领域的“重大突破”。


(资料图片仅供参考)

Meta 表示,该模型可以在近 100 种语言之间进行文本到语音的翻译,并支持 35 种语言的完全语音到语音翻译,而此前要想实现类似的操作只能在单独的 AI 模型中分别进行翻译。SeamlessM4T 支持:

1、近 100 种语言的语音识别。

2、近 100 种输入和输出语言的语音到文本翻译。

3、支持近 100 种输入语言和 36 种输出语言的语音到语音翻译。

4、支持近 100 种语言的文本到文本翻译。

5、支持近 100 种输入语言和 35 种输出语言的文本到语音翻译。

目前,Meta 将以研究许可证的形式向公众免费提供该模型(仅限非商业用途),以便研究人员和开发人员在此基础上开展工作。

据介绍,Meta 还将发布 SeamlessAlign 元数据,这是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达 270000 小时。

马克・扎克伯格表示,他坚信这些工具将促进来自全球各地的用户在元宇宙中的互动,这也是他对该公司未来的赌注所在。

他还表示,开放 AI 生态系统对 Meta 有利,因为该公司通过有效地将创建面向消费者的工具的任务众包来获得更多收益,而不是通过访问模型来收费。

据称,Meta 后续还将把这些翻译和转录方面的 AI 进展整合到 Facebook、Instagram、WhatsApp、Messenger 和 Threads 中。

关于 SeamlessM4T 模型,Meta 研究人员在一份研究论文中表示,他们从“爬取的网页数据的公开可用存储库中”收集了 400 万小时的“原始音频”,但IT之家没有找到具体是哪个存储库的说明,官方只提到文本数据来自去年创建的数据集,而该数据集来自于维基百科及相关网站提取的内容。

标签:

最新
  • 中秋的来历及传说简写

    一、中秋节来历一般有三种说法:1、源于古代帝王的祭祀活动先秦西汉的

  • 哈市市民买菜时要注意了!这种“灯”禁止使用

    12月1日起再用“生鲜灯”违法!哈市市场监管局“检查+指导”督促食用农

  • 超强台风“卡努”向浙闽一带沿海靠近 海洋灾害Ⅱ级应急响应拉响

    中新社北京8月2日电(记者阮煜琳)记者从中国自然资源部获悉,受今年第6

  • 北京来福士新展聚焦意大利艺术传承

    北京日报讯(记者王广燕)文艺复兴时期的艺术巨匠,对意大利艺术与设计

  • 迪哲医药跌3.99% 2021上市募21亿正拟定增募不超26亿

    迪哲医药跌3 99%2021上市募21亿正拟定增募不超26亿

  • 出太阳了!草地上长满了

    在四川总有一个奇怪的现象只要太阳一出来草坪上就会长出很多的四川人网

  • 晨曦航空:拟定增募资不超2.06亿元 用于直升机研发中心项目

    晨曦航空公告,公司拟以简易程序向特定对象发行股票的募资不超过2 06亿

  • 巴南等12个区县将出现短时强降水 局部伴有雷电

    重庆市气象台8月1日13时24分发布强降水警报,预计未来2小时内巴南区、

  • 意媒:国米都灵有意佩雷拉,但贝西克塔斯已开出合同并说服球员

    直播吧8月1日讯据全市场报道,罗贝托-佩雷拉不太可能会加盟国米,贝西

  • 离婚后对方拒不支付抚养费判刑

    一、离婚后对方拒不支付抚养费判刑离婚后对方拒不支付抚养费轻者处以三

  • 爱原理彩英文(爱原理彩)

    来为大家解答以上问题,爱原理彩英文,爱原理彩很多人还不知道,现在让

  • 精进电动: 公司是小鹏汽车的供应商,公司的产品主要配套G3和P7车型

    精进电动(688280)01月01日在投资者关系平台上答复了投资者关心的问题。

  • 邓州市人社局:优质服务暖人心 企业致谢送锦旗

    近日,金星集团(南阳)啤酒有限公司向邓州市人社局赠送了一面印有争做

  • 受东北冷涡影响,未来几天,内蒙古东北部强对流频发,西部需防范高温灾害风险

    小·暑疏忽温风至因循小暑来今天16时30分我们迎来了夏天的第五个节气小

  • 上汽集团正在寻求在欧洲建立首家工厂

    上汽集团已确认正在寻求在欧洲建立首家工厂,该工厂将主要生产电动汽车

  • 华为昇腾计算业务总裁张迪煊谈“百模大战”:当前各家存在产业分工,未来将会有所收敛丨WAIC 2023

    7月6日至8日,2023世界人工智能大会在上海举办。开幕首日,在华为昇腾

  • 旅游
    • 医药板块大幅走低 多股跌超4%

    • 内乡县余关镇卫生院:开展2023年救助困难大学生圆梦行动捐款活动

    • 古蒂:若姆巴佩续约就证明他只为了钱,那皇马必须买哈兰德

    • 一级建造师打印准考证时间2023