Facebook提出神经蛋分离:训练ML系统从嘈杂/杂乱的环境中提取音频/视频
Facebook今天提出一种在嘈杂环境中识别不同图像和声音的新方法,这是机器学习(ML)系统的长期挑战。这项技术被称为神经蛋分离(NES) - 分离蛋清和蛋黄的参考 - 这种方法通过一系列清晰的信号和模糊的信号之间的隔离来隔离音频和视觉来源。人类天生善于分离个别声音和视觉效果,例如在拥挤的鸡尾酒会上听到别人的声音,或者在动物穿过灌木丛时发现动物。但依赖于机器学习的应用程序通常很难完成这项任务。研究人员提出了NES,这是一种半监督方法,结合了训练和估计的各个方面。在该迭代方法中,系统通过将信号混合在一起并进行多个分析来分离已知和未知分布。在此过程中,系统逐渐将更多已知信号注入混合物中,同时模型在隔离和提取时不断改进。我们的实验表明,NES明显优于采用类似监督的其他方法 - 即使对使用全面监督的系统也具有竞争力。