Google AI 更博:YouTube 故事中的视听语音增强
今日,Google AI 通过 YouTube 故事(iOS 端)的新视听语音增强功能向用户提供「听着说」技术,使创作者可以通过自动增强声音并减少背景噪音来拍摄更好的自拍视频。将这项技术掌握在用户手中并非易事。在过去的一年中,该机构与用户紧密合作,以了解他们希望如何使用这种功能,在什么情况下以及希望在视频中获得语音和背景声音的平衡。Google AI 对「听着想」模型进行了重大优化,以使其能够在移动设备上高效运行,总体上将论文发表时的运行时间从台式机上的 10 倍实时降低到了手机上的 0.5 倍实时性能。此外,研究人员还对该技术进行了广泛的测试,以验证该技术在不同的录音条件下以及对于具有不同外观和声音的人而言是否始终如一。