Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

鸡尾酒会效应

鸡尾酒会效应(cocktail party effect)是指人的一种听力选择能力,在这种情况下,注意力集中在某一个人的谈话之中而忽略背景中其他的对话或噪音。这种特殊的听力能力可能是由人类的语音生成系统,听觉系统,或高层次的感性和语言处理的特点所决定的。

简介

描述

鸡尾酒会效应(cocktail party effect)是指人的一种听力选择能力,在这种情况下,注意力集中在某一个人的谈话之中而忽略背景中其他的对话或噪音。这种特殊的听力能力可能是由人类的语音生成系统,听觉系统,或高层次的感性和语言处理的特点所决定的。

来源

[1] 维基百科

[2] Arons, Barry. "A review of the cocktail party effect." Journal of the American Voice I/O Society 12.7 (1992): 35-50.

来源URL

[1]https://en.wikipedia.org/wiki/Cocktail_party_effect

[2]https://www.media.mit.edu/speech/papers/1992/arons_AVIOSJ92_cocktail_party_effect.pdf

在某个聚会上你遇到了一个老同学,你们相谈甚欢,虽然周围其他人的说话声很大,背景音乐嘈杂,你依然可以分辨出并且听明白老同学说的话,并且无意识地屏蔽掉周围人说话的内容。

发展历史

1953年,Colin Cherry提出了著名的”鸡尾酒会”问题:在嘈杂的室内环境中,比如在鸡尾酒会中,同时存在着许多不同的声源:多个人同时说话的声音、餐具的碰撞声、音乐声以及这些声音经墙壁和室内的物体反射所产生的反射声等。在声波的传递过程中,不同声源所发出的声波之间(不同人说话的声音以及其他物体振动发出的声音)以及直达声和反射声之间会在传播介质(通常是空气)中相叠加而 形成复杂的混合声波。因此,在到达听者外耳道的混合声波中已经不存在独立的与各个声源相对应的声波了。然而,在这种声学环境下,听者却能够在相当的程度上听懂所注意的目标语句。听者是如何从所接收到的混合声波中分离出不同说话人的言语信号进而听懂目标语句的呢?

自此,计算机科学家,语音学家,认知学家,心理学家等大量的科学家试图去解决这个问题。至今尚未有效解决该问题。

主要事件

年份事件相关论文
1953Cherry提出了鸡尾酒会问题Cherry, E. C. (1953). Some experiments on the recognition of speech, with one and with two ears. The Journal of the acoustical society of America, 25(5), 975-979.
1954W. Spieth等人进行两只耳朵同时听见不同信息的实验Spieth, W., Curtis, J. F., & Webster, J. C. (1954). Responding to one of two simultaneous messages. The Journal of the Acoustical Society of America, 26(3), 391-396.
Webster, J. C., & Thompson, P. O. (1954). Responding to both of two overlapping messages. The Journal of the Acoustical Society of America, 26(3), 396-402.
1971麦克风阵列被提出用于鸡尾酒会效应Mitchell, O. M., Ross, C. A., & Yates, G. H. (1971). Signal processing for a cocktail party effect. The Journal of the Acoustical Society of America, 50(2B), 656-660.
1976D. A. Norman指出了短时记忆与听力之间的联系,从认知学角度对鸡尾酒会效应做了一定分析Norman, D. A. (1976). Memory and attention.
1978Durlach等人发现,两耳同时接收声音比单耳接收可提高25dB的信噪比Handbook of Perception, Hearing, Volume IV,chapter 10
1983Blauert对人声定位进行了精神物理学分析Blauert, J. (1997). Spatial hearing: the psychophysics of human sound localization. MIT press.
1988麦克风阵列开始被广泛用于消除噪声Zelinski, R. (1988, April). A microphone array with adaptive post-filtering for noise reduction in reverberant rooms. In Acoustics, Speech, and Signal Processing, 1988. ICASSP-88., 1988 International Conference on (pp. 2578-2581). IEEE.
1990Bregman分析了各类听觉场景问题,对听觉刺激等感知进行了分组和总结Bregman, A. S. (1994). Auditory scene analysis: The perceptual organization of sound. MIT press.
1992Arons从听觉角度对鸡尾酒会效应进行了一次总结Arons, B. (1992). A review of the cocktail party effect. Journal of the American Voice I/O Society, 12(7), 35-50.
2005Haykin和Chen从人类听觉,大脑和计算机等多角度对鸡尾酒会问题进行了一次分析Haykin, S., & Chen, Z. (2005). The cocktail party problem. Neural computation, 17(9), 1875-1902.
~now以语音学家为主的科学家们提出降噪,人声噪声分离等可一定程度解决鸡尾酒会问题的方法Aoki, P. M., Szymanski, M. H., Thornton, J. D., Wilson, D. H., & Woodruff, A. G. (2009). U.S. Patent No. 7,617,094. Washington, DC: U.S. Patent and Trademark Office.
Mohammadiha, N., & Leijon, A. (2013). Nonnegative HMM for babble noise derived from speech HMM: Application to speech enhancement. IEEE Transactions on Audio, Speech, and Language Processing, 21(5), 998-1011.
Garnier, M., & Henrich, N. (2014). Speaking in noise: How does the Lombard effect improve acoustic contrasts between speech and ambient noise?. Computer Speech & Language, 28(2), 580-597.
Dennis, J. W. (2014). Sound event recognition in unstructured environments using spectrogram image processing. Nanyang Technological University, Singapore.

发展分析

瓶颈

噪声与人声的分离,不同人声的分离,不同距离的噪声人声分离等等,是目前解决鸡尾酒会效应问题的一大发展瓶颈。

未来发展方向

结合人耳的听觉认知特性,依靠语音信号处理和语音识别技术,如何有效降低信噪比,分离对语音识别系统有用的人声信号和各种环境中的非特定噪声信号,将是研究的重点。

Contributor: Yuanchao Li

简介