从 频率 到 率频 : 倒频谱的历史


在人人上网的今天,每时每刻都有新网络用语被制造出来,而且在不断的推陈出新。这些风趣,怪诞的网络用语时刻都在挑战着人们的想象力。

不吹不黑、基佬紫、妖精打架、偶像包袱、岚语、下海、甩棍、学婊、中二病、欧皇、信息茧房、小鸟伏特加、娘惹 、廾匸 mcn、肖哩肖哩、千万直拍、857、豆瓣鹅组、栗子头、上分工具、vlog、刷锅水、淦、豌豆公主、吃饭睡觉、豆豆… 鲍勃、疫医、颜性恋、233333、提百万、并蒂莲警告、朝鲜李子柒、恋爱循环、大尾巴狼、勇武、下药综艺……

▲ 网络用语

但如果说起一本正经的制造新的怪诞词语的话,还需当属上个世纪中的一篇经典信号处理论文。当下面成对词语的左边单词出现在论文中,可以想象当时的杂志编辑一脸懵逼样子,左边的词语与右边的单词有啥关系?为何这样创造词语呢?

在一篇他们的经典论文写作过程中:用于回声检测的时间序列同态频率分析:倒频谱、伪自协方差,互倒频谱以及倒相位分裂[1]Bogert, HealyTurkey也许正处在脑子兴奋发热状态,捏造出了一系列的新单词 cepstrum (倒频谱)rahmonicsliftering等等。为什么使用交换辅音的方式把一些常见的单词转换成新的单词,他们的简单回复:总体上我们在处理频域信号的方式与处理时域信号方式相同,反之亦然。

为了说明什么导致词语倒频谱(cepstrum)被捏造出来,我们考察一个简单的带有回声的信号:

这个信号的傅里叶频谱密度表示为:

从 上是我们可以看到,带有回声的信号频谱密度具有一个包络线(原信号的频谱)去调制一个频率的周期函数(回声带来的频谱变化)。对频谱取对数,上述乘积就转换成两个成分的叠加,具体来讲:

这样, 可以看成一个叠加有一个周期成分的波形,其中基本周期就是回声的延迟时间   。在传统时间信号分析中,这种周期成分表现在频谱中就是一个谱线,或者频谱尖峰。因此,对频谱的对数如果在取频谱的话,就会出现一个峰值,只要原来信号中存在一个回声信号的话。这个新的频谱域,不是传统意义上的频域,也不是时域。因此为了避免在于熟悉的概念联系的时候造成混淆, Bogert 等人选择将它们成为 “倒频率域” (quefrency domain), 也将时间波形的频谱对数再取频谱称为 “倒频谱” (cepstrum)。论文中大部分新造的的单词都逐步被人遗忘,但倒频谱 (cepstrum) 存活下来并成为数字信号处理中的术语。

▲ 图1 一段使用Hamming窗截取的声音信号,时间长度为50ms。可以通过短时傅里叶变换来对时间长相连的片段进行分析。在这个元音特殊时间片段中,喉音周期为12.5ms

早在上个世纪六十年到,与 Bogert 等人的工作 完全没有联系, MIT的 Al Oppenheim 的博士独立研究论文是关于一大类非线性信号处理技术,启发于从代数群到向量空间上的同态映射(homomorphic mapping), 也就是广义上的线性。他的博士论文在1964年五月在MIT完成,题目是 :一类非线性系统中的叠加性,发展出了被称为同态系统的非线性信号处理理论。应用这样系统处理信号被称为 “同态滤波”。

同态系统理论的主要思想是基于很多信号处理操作满足相同的代数假设,比如信号叠加。因此,在信号空间中的同态映射使得这些其他操作扮演着信号(向量)叠加的角色,本质上是广义上的线性映射。这就为将一些不是简单相加混合在一起的信号的分离提供了新的解决方法。例如,通过卷积运算,或者乘积运算,两个信号叠加在 一起。人们积极考虑同态信号分离技术的各种潜在的应用,最基本的应用就是进行解卷积和反乘积信号运算。

发展同态滤波算法的第一步就是需要研究出同态系统的基础理论和实现方法。Al Oppenheim的博士论文表明,所有同态系统都具有标准的结构形式,包括三个系统的级联。第一个是可逆非线性特征算子(系统)将非叠加性组合操作,例如卷积,映射到普通的相加运算。第二个系统是线性系统,遵从相加叠加,第三个系统是第一个非线性系统的你系统。

▲ 图2 对数幅度谱(上图蓝色),在对数幅度谱上进行低频滤波(线性滤波)(上图红色),倒频谱(下图蓝色)

上述就是对于前面声音片段波形的分析。在上图中对于对数幅度谱中的快速变化曲线就是语音的离散傅里叶变换的对数幅度谱。下图就是计算的倒频谱,也就是将对数幅度谱进行傅里叶反变换。可以看到其中有一个“倒谐波”(rahmonic)的峰值在 1/80=12.5ms,对应原始语音中的伪周期频率。就是时间波形的周期。在倒频谱中寻找这种峰值是Noll 音调检测算法的基础。

这样,对于通过卷积叠加的信号,同态解卷积系统将卷积映射到相加,然后相加到相加,最后相加在返回到卷积。

对于卷积运算(使用 表示),对应的特征算子 具有以下性质: ,其中:

一个直观明显的算子 的实现就是对信号进行复数傅里叶变换,再取复数对数。这样,当两个信号卷积在一起,他们的傅里叶变换就是相乘,对应的复数对数就是两个傅里叶变换对数的叠加。对于叠加结果取反傅里叶变换就是单个信号的反变换,所以将三个操作的级联:傅里叶变换 复数对数 反傅里叶变换,就将卷积映射到对应信号的叠加。有趣的是这种方法正逢Cookey,Tukey 在1965年发表她们的快速傅里叶变换(FFT),于是FFT给实现傅里叶变换以及非线性映射 提供了有效的方法。

关于倒频谱与同态滤波之间的巧合,以及这些理论所引发的大量有趣的应用,都记录在Al Oppenheim教授的文章: From Frequency to Quefrency: A History of the Cepstrum[2] 中。在这里就不在一一累述了,感兴趣的读者可以自行参考原文。

之所以今天重新阅读了这篇文章,他告诉我们,正经科学技术研究的起源中也充满着许多丰富多彩、诙谐浪漫的想法。

参考资料

[1]

倒频谱、伪自协方差,互倒频谱以及倒相位分裂: https://www.semanticscholar.org/paper/The-quefrency-analysis-of-time-series-for-echoes-%3A-Bogert/15bb1365026071ae3423d64ed2d18c554cafd6f6

[2]

From Frequency to Quefrency: A History of the Cepstrum: https://www.researchgate.net/publication/3321562_From_Frequency_to_Quefrency_A_History_of_the_Cepstrum?enrichId=rgreq-0da4f1481198f8bea983bc251a562e7a-XXX&enrichSource=Y292ZXJQYWdlOzMzMjE1NjI7QVM6MjEyNzE1NDI0NDg5NDcyQDE0Mjc3MjY3MTcxMzI%3D&el=1_x_3&_esc=publicationCoverPdf

作者:极客石头

在搞事情的路上越走越远。

发表评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注