GitHub Stars 秒破万,Meta 开源能识别 4000 种语言、生成 1000 多种语音大模型!-天天观点

2023-05-24 13:14:16   来源:商业新知网

来源 | AI科技大本营


(资料图片)

整理 | 屠敏

出品 | CSDN

和 OpenAI、Google 分道扬镳,Meta 在开源大模型方向上越走越深。

今日,Meta 在 GitHub 上再次开源了一款全新的AI 语言模型——Massively Multilingual Speech ( MMS,大规模多语种语音 ),它与 ChatGPT 有着很大的不同,这款新的语言模型可以识别 4000多种口头语言并生成 1100 多种语音(文本到语音)。

在上线短短的几个小时,该 GitHub 库便收获了 23k Star,Fork 数量高达 5.5k。

GitHub 地址: https://github.com/facebookresearch/fairseq/tree/main/examples/mms

初衷

对于开发这款 MMS 模型,Meta 表示,「为设备配备识别和产生语音的能力可以让更多的人访问信息」。

不过,虽然全球已知的语言种类高达 7000 多种,但是现有的 AI 语音识别模型仅能够涵盖 100 种语言,范围太小了。

同时, 语音识别和文本转语音模型通常需要对数千小时的音频进行训练 ,对于大多数语言而言,这些数据根本就不存在。甚至全球多种语言在时代不断发展中,会有不少在未来几十年有消失的危险。

为了能够保护世界上语言的多样性,也想要为濒临消失的语言做一些贡献,Meta 研究团队研发并开源了 MMS,「我们公开分享我们的模型和代码,以便研究界的其他人可以在我们工作的基础上进行构建」。

当然,想要收集数千种语言的音频数据是开发这款大模型首先需要克服的困难。

在最新的 MMS 开源语音模型中,Meta 使用了一种非常规的方法来收集音频数据,他们使用了圣经等宗教文本。

Meta 对此解释称,“我们使用宗教文本,是因为这些文本已被翻译成多种不同的语言,并且其译文已被广泛研究用于基于文本的语言翻译研究。这些翻译有公开的录音,记录了人们用不同的语言阅读这些文本的情况。”

作为大模型项目的一部分,Meta 创建了 1100 多种语言的数据集,每种语言平均提供 32 小时的数据。

另外,结合圣经和类似文本的未标记录音,Meta 的研究人员将模型的可用语言增加到 4,000 多种。

支持数千种语言的单一语音模型

当然,依靠这些数据,很多人认为这个是偏向宗教的一种 AI 模型。事实上,Meta 表示,并非如此。

Meta 在公告中写道, “虽然录音的内容是宗教的,但我们的分析表明, 这并没有使模型过度偏向于产生更多的宗教语言。 我们认为这是因为我们使用了连接主义时间分类 (CTC) 方法,与用于语音识别的大型语言模型 (LLM) 或序列到序列模型相比,这种方法受到的限制要大得多。”

在训练这个模型时,Meta 结合使用了自家公司的“自监督语音表示学习”模型——wav2vec 2.0,它可以在未标记的数据上进行训练。结合非常规数据源和自我监督的语音模型能够带来不错的效果。

根据官方测试数据表明,与现有的模型相比,Meta 在使用 1B 参数 wav2vec 2.0 模型在 1,100 多种语言上训练了多语言语音识别模型。随着语言数量的增加,性能确实会下降,但幅度很小:从 61 种语言增加到 1,107 种语言,字符错误率仅增加了约 0.4%,但语言覆盖率增加了 18 倍以上。

在与 OpenAI 的 Whisper 模型比较时,其在 Massively Multilingual Speech 数据上训练的模型实现了一半的单词错误率,但 Massively Multilingual Speech 涵盖的语言是其 11 倍。

毋庸置疑,MMS 开源模型的到来,不仅扩大了文本生成语音的语言范围,也极大地提升了准确率。

局限性

不过,Meta 警告说它的新模型并不完美。该公司写道:“例如,语音转文本模型可能会错误转录选定的单词或短语,这存在一定风险。”

“根据输出结果,这可能会导致攻击性或不准确的语言。我们仍然相信,整个 AI 社区的协作对于负责任地开发 AI 技术至关重要。”

对于语音大模型的未来,Meta 称也做了设想,希望可以通过一个模型解决所有语言的多个语音任务。“虽然我们为语音识别、语音合成和语言识别训练了不同的模型,但我们相信在未来,一个模型将能够完成所有这些任务以及更多任务,从而带来更好的整体性能”,Meta 说道。

当然,我们也期望这一天能够早日到来。

关键词:

精彩阅读

GitHub Stars 秒破万,Meta 开源能识别 4000 种语言、生成 1000 多种语音大模型!-天天观点

热点

和OpenAI、Google分道扬镳,Meta在开源大模型方向上越走越深。

【国金计算机|行业点评】华为完成全球88家子公司MetaERP切换,重视ERP国产替代

热点

5月23日消息,华为仅用15小时便完成全球88家子公司MetaERP大规模切换。

像监管核武器一样监管AI,OpenAI高层发文探讨「超级智能」监管

热点

如今,听证会已经过去一周,OpenAI高层又以书面的形式阐述了他们对监管的看法。

腾讯企点客服赛道国内TOP1!Gartner报告公布最新市场份额|观察

热点

作为CRM本土领军品牌,腾讯企点致力于提供数智驱动的营销服一体化CRM产品,为企业提供高效的数字营销与服务

当前热议!天涯社区再被执行31万,累计被执行超1.23亿

热点

5月22日,天涯社区网络科技股份有限公司及其旗下海南智能岛科技开发有限公司新增一则被执行人信息。

【天天报资讯】金山软件一季度营收19.7亿,同比增长6%,不及市场预期

热点

金山软件方向瞄准人工智能,网游版块或将再添新游。

​四大运营商重磅联手!中国形成全球最大5G异网漫游标杆指日可待|焦点热议

热点

5G基础设施投资巨大,网络共享和异网漫游被认为是大幅度降低5G基础设施成本的有效手段。

AI诈骗正在全国爆发!“10分钟被骗430万”,财务人应如何应对?

热点

近日,AI诈骗正在全国爆发的话题冲上热搜第一,引发网友热议。

9.8亿!电信、联通拿什么追赶移动?-世界观焦点

热点

近日,三大运营商陆续发布了自家“月考”成绩单,既无惊喜,也无意外。

财富

传统电视转播加速消亡,ESPN要坚决拥抱流媒体了

资讯

传统电视转播加速消亡,ESPN要坚决拥抱流媒体了,ESPN彻底导向流媒体平台,或许只是时间问题。

天天热头条丨大众否认与华为谈判,为何屡有合作传闻?

资讯

大众否认与华为谈判,为何屡有合作传闻?,疫情开放后,外界原本期望越南能够延续此前的增长奇迹然而越南经

80后交大校友联手教授干出一个IPO,孙正义押注

资讯

80后交大校友联手教授干出一个IPO,孙正义押注,节卡机器人Pre-IPO轮融资10亿元,淡马锡、软银愿景基金等机

即时焦点:「AI诈骗」冲上热搜第一,我们整理了一份普通人反诈指南

资讯

「AI诈骗」冲上热搜第一,我们整理了一份普通人反诈指南,AI改变诈骗,普通人如何自处?

讯息:咖啡奶茶都不行,年轻人疯狂“移情”酸奶

资讯

咖啡奶茶都不行,年轻人疯狂“移情”酸奶,谁能角逐新潮饮王座?

下一个10年,两种人不会被取代

资讯

下一个10年,两种人不会被取代,面对ChatGPT后的变局,市场人才的新标准是什么?

花1万块找「蛋搭子」陪玩,00后的游戏社交有多野?_天天播报

资讯

花1万块找「蛋搭子」陪玩,00后的游戏社交有多野?,恋爱、购物、学外语……

孙燕姿回应“AI孙燕姿”;阿里云回应裁员7%;微软CEO宣布:Windows的“AI时刻”来了;中国批准微软收购动视暴雪丨邦早报

资讯

孙燕姿回应“AI孙燕姿”;阿里云回应裁员7%;微软CEO宣布:Windows的“AI时刻”来了;中国批准微软收购动视

环球热推荐:暑期档,还有点空

资讯

暑期档,还有点空,疫情改变了市场

10块钱解决两餐饭,年轻人爱上“剩菜盲盒” 新动态

资讯

10块钱解决两餐饭,年轻人爱上“剩菜盲盒”,既环保,又省钱,堪称完美消费

【国金计算机|行业点评】华为完成全球88家子公司MetaERP切换,重视ERP国产替代

5月23日消息,华为仅用15小时便完成全球88家子公司MetaERP大规模切换。

像监管核武器一样监管AI,OpenAI高层发文探讨「超级智能」监管

如今,听证会已经过去一周,OpenAI高层又以书面的形式阐述了他们对监管的看法。

腾讯企点客服赛道国内TOP1!Gartner报告公布最新市场份额|观察

作为CRM本土领军品牌,腾讯企点致力于提供数智驱动的营销服一体化CRM产品,为企业提供高效的数字营销与服务

当前热议!天涯社区再被执行31万,累计被执行超1.23亿

5月22日,天涯社区网络科技股份有限公司及其旗下海南智能岛科技开发有限公司新增一则被执行人信息。

【天天报资讯】金山软件一季度营收19.7亿,同比增长6%,不及市场预期

金山软件方向瞄准人工智能,网游版块或将再添新游。

当前热门:山不在高有仙则名水不在深有龙则灵书法作品楷书_山不在高有仙则名水不在深有龙则灵

1、陋室铭!!刘禹锡(772~842)唐代文学家、哲学家。2、字梦得。3、洛阳(今属河南)人,生于嘉兴(今属浙江)。4

环球即时:西安加快推动文旅融合发展 促星级饭店消费提升

图为活动现场。西安市文化和旅游局供图5月23日,由西安市文化和旅游局主办的“金口碑”十佳星级饭店评选暨

平安百万医疗健康告知内容有哪些?能带病投保吗?

健康状况:主要包括身高、体重、血压、血糖、胆固醇、肝功能、肾功能等。疾病史:申请人是否曾经患有重大疾

当前通讯!英镑/美元实时行情走势分析(2023年5月24日)

5月24日,周三亚市早盘,英镑 美元出现三年来的首次单日上涨,在英国关键通胀数据和英格兰银行行长Adrwaily

莫斯科法院延长对美国记者拘留 俄方:他或面临20年监禁

海外网5月24日电据今日俄罗斯国际通讯社23日报道,莫斯科一家法院当天证实,3月下旬在俄罗斯被捕的《华尔街

人民日报点赞青岛:​优化环境,让消费更放心_热闻

提升市场硬件条件,建设维权服务站,山东青岛——优化环境,让消费更放心本报记者王沛李蕊图①:夜晚,青岛