降采样是数位信号处理领域中的一种多速频数字信号处理(multi-rate digital signal processing)系统中采样率转换(sample rate conversion)技术的一种,或指代用来降低信号采样率的过程,与插值相反——插值用来增加取样频率——降采样通常用于降低数据传输速率或者数据大小。因为降采样会有混叠的情形发生,系统中具有降采样功能的部分称为降频器(decimator)。
降采样因子(decimator factor)一般是大于1的整数或分数,用“M”表示,表示取样周期的倍数或是取样频率的因数。当M为整数时,降采样过程为:
- 利用数位低通滤波器去除讯号中的高频成分;
- 对过滤高频后的讯号降采样M倍,换言之,保留原讯号中间隔为M的取样点;
如果没有按照第一步先去除讯号中的高频成分,会造成混叠(aliasing),即取样信号被还原成连续信号时产生彼此交叠而失真的现象。
当采样因子为分数时,将其写作M/L,使得M>L,此时降采样步骤变为:
- 以L倍频率升采样;
- 以1/M倍频率降采样;
升采样需要低通滤波器过滤资料数率增加的讯号,降采样需要低通滤波器过滤输入讯号,因此这两个滤波过程可以被和而为一,借由用单一个低通滤波器取代,此单一低通滤波器的截止频率为两者低通滤波器的低者。
举例来说,假如降采样因子为2,44100赫兹的16位元数字音乐讯号被降采样到22050 赫兹;若降采样因子为5/4,则取样频率变为35280。
[描述来源:Lyons, Richard (2001). Understanding Digital Signal Processing. Prentice Hall. p. 304. ISBN 0-201-63467-8. Decreasing the sampling rate is known as decimation. ]
[描述来源:维基百科 URL: https://en.wikipedia.org/wiki/Decimation_(signal_processing)#cite_note-1 ]
发展历史
降采样作为降低信号采样率的技术,无法查找到提出具体的概念是由谁在何时提出的,而其发展到现在,降采样已经包含了适用于不同目的的多种算法。1940年起发表的论文已经涉及到降采样,但没有涉及其具体的应用场景及于之配套的算法。到1990年起关于降采样的论文数量大幅增长,开始有论文讨论高效、低成本的视频压缩和图片压缩的降采样算法。由此开始关于降采样的研究持续增多,2000年以后关于用于图片压缩的降采样算法的论文已经非常多,并且有了更细致的研究方向,如基于降采样的面部识别、降采样对于视频质量的影响、通过最大生成树(Maximum Spanning Trees)进行降采样等等。
在机器学习领域,降采样可以应用于解决数据不平衡的问题,如得到的医疗数据中健康的病例过多而患病的数据过少,通过降采样,可以在数据预处理阶段对多数类重新取样从而生成均衡的样本,降低数据不平衡对模型的影响。另外,深度神经网络(deep neural network)中的pooling也是降采样的一种实际应用。
主要事件
年份 | 事件 | 相关论文 |
1997 | N. Merhav和 V. Bhaskaran发表了论文讨论对图片快速进行降采样的算法。 | N. Merhav; V. Bhaskaran. (1997). Fast algorithms for DCT-domain image downsampling and for inverse motion compensation. IEEE Transactions on Circuits and Systems for Video Technology. |
2003 | Jianguo. Yand和S. T. Park 提出抗混叠离散小波变换算法 | Jianguo. Yand; S. T. Park. (2003). AN ANTI-ALIASING ALGORITHM FOR DISCRETE WAVELET TRANSFORM. Mechanical Systems and Signal Processing. 17(5):945-954. |
2006 | W. Lin; Li Dong提出了自适应降采样算法 | W. Lin; Li Dong.(2006). Adaptive downsampling to improve image compression at low bit rates. IEEE Transactions on Image Processing. 15(9): 2513 - 2521. |
2011 | Roberto R., Matthew A. B., Vincent L. 探讨了稀疏表示(sparse representation)——其中包含pooling——对图片分类的影响 | Roberto R.; Matthew A. B.; Vincent L. (2011). Are sparse representations really relevant for image classification? IEEE Conference on Computer Vision and Pattern Recognition (CVPR). |
发展分析
瓶颈
与其说是瓶颈,降采样的两个难点在于如何防止混叠的情形,混叠是指取样信号被还原成连续信号时产生彼此交叠而失真的现象。当混叠发生时,原始信号无法从取样信号还原。因此在取样前,必须用一个抗混叠滤波器将高于奈奎斯特频率的频率成分滤掉。但在实际情况下,任何滤波器都无法达到理论上的理想情况;
另一个难点是如何减少降采样后图片/视频质量的下降,如在对图片数据进行降采样后,图片的大小会下降,如何保证在此情况下降采样能够有效的滤去不重要的信息而保留有效的信息。
未来发展方向
有关降采样的论文非常多,其研究方向也非常多,目前关于这个领域的研究仍在活跃中。有很多研究集中在设计防止混叠的降采样算法、或改进现有算法以实现不同的图片/视频压缩目的。还有一个较新的研究领域是将降采样算法与神经网络算法结合起来,使得降采样作为数据预处理的步骤。
Contributor: Yuanyuan Li