文章库 PRO通讯会员 SOTA！模型

行业内参

AI Daily

AI Daily 快讯 · 2018/12/27

深度学习将单声道录音转变为沉浸式声音

对于在附近的树上唱歌的鸟，你可以相对快速地识别它的大致位置而不用看。当你过马路时，听听汽车引擎的轰鸣声，你通常可以立即告诉它是否在你身后。人类在三维空间中定位声音的能力是非凡的。这种现象很好理解 - 它是我们耳朵不对称形状和它们之间距离的结果。但是，虽然研究人员已经学会了如何创建容易欺骗我们的视觉系统的 3D 图像，但没有人找到一种令人满意的方法来创建合成的 3D 声音，令人信服地欺骗我们的听觉系统。近日，得克萨斯大学的 Ruohan Gao 和 Facebook Research 的 Kristen Grauman 发表了他们的研究。他们使用了人类也利用的技巧来教 AI 系统将普通的单声道声音转换成非常好的 3D 声音。研究人员称它为 2.5D 声音。以下是论文链接：https://arxiv.org/abs/1812.04204 （MIT Tech Review）

AM 8:20www.technologyreview.com

登录后评论

暂无评论

暂无评论~

登录

PRO会员通讯

文章库 PRO通讯会员 SOTA！模型