2025/01/07 14:49

推动多语言语音科技迈向新高度：INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛

随着语音技术在各领域应用的迅速扩展，全球语言与口音的多样性成为技术进一步突破的重大挑战。为了应对这一难题，来自卡内基梅隆大学（CMU）、斯坦福大学（Stanford University）、乔治梅森大学(George Mason University)、台湾大学与芝加哥丰田技术学院(TTIC)的研究团队连手，在即将举行的 INTERSPEECH 2025 国际会议上推出了 ML-SUPERB 2.0 挑战赛（Multilingual SUPERB 2.0 Challenge）。该挑战旨在推动多语言语音技术迈向新高度，为语音科技的全球化应用奠定坚实基础。

语言数量规模

ML-SUPERB 2.0 提供了包含大量不同语言的语音数据集。

●训练集：涵盖 141 种语言的丰富语音数据，从主流语言到稀有方言，为参赛者提供多元化的语言资源以训练模型。

●开发集：包含训练集中的141种语言，和另外的56 种方言与口音，为模型性能的全面评估提供支持。

这些数据反映了全球语言的多样性，确保技术不仅服务于主流语言，更覆盖小众语言。

新型评估机制

ML-SUPERB 2.0 在评估机制上进行了创新，模型评估指针除了传统的语音识别和语言识别错误率外，还强调模型在每种语言上都具备稳定性能，真正做到对所有语言的友好支持，激励研究者关注小众语言与弱势语言的平等支持，最终实现“No Language Left Behind”。

主办方提供算力进行推论

为提升参赛体验，降低参赛门坎，挑战赛引入了在线实时排名系统。参赛者只需提交模型，即可由主办单位提供算力进行推论，实现快速评估与实时反馈。

引领语音科技的未来

ML-SUPERB 2.0 挑战赛不仅是一场技术比拼，更是推动语音科技迈向新纪元的重要一步。通过凝聚全球研究者与开发者的力量，挑战赛将加速多语言语音技术的创新与普及，为语音技术的应用场景带来更多可能性。参赛者可前往官方网站 (https://multilingual.superbbenchmark.org/) 获取详细信息，并在 2025 年 2 月 7 日前提交结果。让我们携手参与这场语音技术的盛会，见证语音科技未来的开启！

产业