不用再怕电视声音唤醒 Amazon Echo,亚马逊新论文进一步解决声音检测难题
去年,亚马逊发布了 Alexa Guard 的测试版,这是一项新服务,让离开家的客户可以指示他们的 Echo 设备监听玻璃破碎或烟雾和二氧化碳警报。
在今年的声学、语音和信号处理国际会议上,亚马逊团队发表了几篇关于声音检测的论文。今天亚马逊博客介绍了其中的两篇。
第一篇论文解决了媒体检测的问题,或者识别数字助理设备捕获的语音何时来自电视或广播而不是人类发言者。研究员通过检查较长持续时间的音频流而不仅仅是对短音频片段进行分类,开发出一种更好地表征媒体音频的方法。媒体检测有助于从语音信号中过滤出特别具有欺骗性的背景噪声。
另一篇论文,研究员使用半监督学习来训练从外部数据集开发的系统来进行音频事件检测。半监督学习使用少量带注释的训练数据来利用更大的未注释数据集。特别是,研究员训练三个不同的模型来执行相同的任务,但是在略微不同的数据集上。汇总他们的输出纠正了半监督训练中的一个常见问题。