研究人员的 AI 系统可从语音记录中去除诸如性别之类的可识别属性
上周在 2020 年国际机器学习国际会议上接受的一项研究中,查尔默斯科技大学和瑞典 RISE 研究所的研究人员提出了一种隐私保护技术,该技术可以学习混淆语音数据中的性别等属性。他们使用经过训练的模型来过滤记录中的敏感信息,然后生成与过滤后的信息无关的新的私人信息,以确保敏感信息保持隐藏状态而不会牺牲现实性和实用性。研究人员的解决方案采用了称为 PCMelGAN 的生成对抗网络(GAN),该模型分为两部分,由生成样本的生成器和试图区分生成的样本与真实样本的鉴别器组成的 AI 模型。它可以将语音记录映射到梅尔频谱图,或随着时间变化而变化的音频信号频谱表示形式,并将它们传递通过过滤器(该过滤器除去敏感信息)和一个生成器(在其位置添加合成信息)。然后 PCMelGAN 将梅尔频谱图输出转换为原始波形形式的音频。(VentureBeat)