深度学习将单声道录音转变为沉浸式声音
对于在附近的树上唱歌的鸟,你可以相对快速地识别它的大致位置而不用看。当你过马路时,听听汽车引擎的轰鸣声,你通常可以立即告诉它是否在你身后。人类在三维空间中定位声音的能力是非凡的。这种现象很好理解 - 它是我们耳朵不对称形状和它们之间距离的结果。但是,虽然研究人员已经学会了如何创建容易欺骗我们的视觉系统的 3D 图像,但没有人找到一种令人满意的方法来创建合成的 3D 声音,令人信服地欺骗我们的听觉系统。近日,得克萨斯大学的 Ruohan Gao 和 Facebook Research 的 Kristen Grauman 发表了他们的研究。他们使用了人类也利用的技巧来教 AI 系统将普通的单声道声音转换成非常好的 3D 声音。研究人员称它为 2.5D 声音。以下是论文链接:https://arxiv.org/abs/1812.04204 (MIT Tech Review)