Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

推动多语言语音科技迈向新高度:INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛

随着语音技术在各领域应用的迅速扩展,全球语言与口音的多样性成为技术进一步突破的重大挑战。为了应对这一难题,来自卡内基梅隆大学(CMU)、斯坦福大学(Stanford University)、乔治梅森大学(George Mason University)、台湾大学与芝加哥丰田技术学院(TTIC)的研究团队连手,在即将举行的 INTERSPEECH 2025 国际会议上推出了 ML-SUPERB 2.0 挑战赛(Multilingual SUPERB 2.0 Challenge)。该挑战旨在推动多语言语音技术迈向新高度,为语音科技的全球化应用奠定坚实基础。

ML-SUPERB 2.0 提供了包含大量不同语言的语音数据集。

●训练集:涵盖 141 种语言的丰富语音数据,从主流语言到稀有方言,为参赛者提供多元化的语言资源以训练模型。

●开发集:包含训练集中的141种语言,和另外的56 种方言与口音,为模型性能的全面评估提供支持。

这些数据反映了全球语言的多样性,确保技术不仅服务于主流语言,更覆盖小众语言。

新型估机制

ML-SUPERB 2.0 在评估机制上进行了创新,模型评估指针除了传统的语音识别和语言识别错误率外,还强调模型在每种语言上都具备稳定性能,真正做到对所有语言的友好支持,激励研究者关注小众语言与弱势语言的平等支持,最终实现“No Language Left Behind”。

方提供算力行推

为提升参赛体验,降低参赛门坎,挑战赛引入了在线实时排名系统。参赛者只需提交模型,即可由主办单位提供算力进行推论,实现快速评估与实时反馈。

领语音科技的未

ML-SUPERB 2.0 挑战赛不仅是一场技术比拼,更是推动语音科技迈向新纪元的重要一步。通过凝聚全球研究者与开发者的力量,挑战赛将加速多语言语音技术的创新与普及,为语音技术的应用场景带来更多可能性。参赛者可前往官方网站 (https://multilingual.superbbenchmark.org/) 获取详细信息,并在 2025 年 2 月 7 日前提交结果。让我们携手参与这场语音技术的盛会,见证语音科技未来的开启!

产业
相关数据
语言识别技术

在自然语言处理中,语言识别或语言猜测是确定给定内容所使用的自然语言的问题。针对该问题的计算方法被视为文本分类的特例,并用各种统计方法解决。

推荐文章
暂无评论
暂无评论~