电机工程

首页 > 电机工程

次频带编码

2018-08-20 14:51:16     所属分类:信号处理

在讯号处理中,次频带编码(sub-band coding)是一种转换编码。其作法是把讯号分成许多频带后独立编码,通常是将资料做压缩的第一步,可应用于声音、多媒体、影像讯号的压缩。

目录

  • 1 应用于声音讯号
    • 1.1 基本理论
    • 1.2 应用
  • 2 影像讯号
  • 3 参考

应用于声音讯号

基本理论

次频带编码在声音讯号上利用听觉遮蔽(auditory masking)且符合人耳的听觉系统。一般而言,人耳可听到一定频率范围的声音,若在某特定频率的讯号强度很大时,人耳对于该特定频率附近的频率辨别率几乎为0,我们称强度很大的讯号遮蔽弱的讯号。次频带编码的基本概念即是舍去那些被遮蔽的频带,这部分为“失真编码”,与原本的讯号不同,但其舍去的讯号经过分析后,仍可以不被人耳所辨别。

应用

最常用于数字化编码的方法是脉冲编码调变(pulse-code modulation),这种方法也适用于CD和录音带。数字化转换将原本的连续讯号取样后,并用最接近的整数bits表示,及量子化(quantization),但这样的方法会产生取舍误差(rounding error),并在取样域产生截断误差(truncation error)。

为了减少误差,必须要增加每个代表取样的位元数,如此一来便造成过大的位元率(像是CD audio的频道就超过700 kbits/s)。实际上,用过的位元表示并没有考虑人耳的听觉系统的敏感度。其改善的方法是用非线性脉冲编码调变,如µ-law编码,适用听觉感知曲线,其截断误差是与讯号能量大小做调变。

其中昇阳电脑(Sun Microsystems)的Au file format是广为人知的µ-law编码方式,使用8位元µ-law编码可使CD audio的频道减低至350 kbits/s,但效果与原本相比,较为逊色。

次频带编码应用的另一个例子是G.722(第一个用于16KHz采样率的宽带语音编码算法),它利用次频带可适性差分脉冲编码调变(sub-band adaptive differential pulse code modulation, SB-ADPCM),位元率在64 kbits/s。SB-ADPCM将频带切成两次频带,每个次频带再分别用ADPCM。

影像讯号

介绍影像之前,先以一个一维讯号为例,如图一所示

图一

图一中,上图表示两频带的的子带编码及解码,输入讯号,分别经过两个分析滤波器(analysis filter)。它们个别的频率响应如下图。其中为低通滤波器,所得到的是讯号的低频部分,其输出为原讯号大略的特征(approximation);为高通滤波器,输出所得到的是讯号的细节(detail)。经过降取样(downsampling)来达到压缩的效果。而图一上图的右半部分别是合成滤波器(synthesis filter),先将,升采样(upsampling)后还原原本的讯号。

图二

接着介绍二维子带编码,如图二所示,二为讯号分经过低通、高通滤波器后对横列降取样,此时会得到两张长度约为原本二分之一的图。再分别对这两张图个别经过低通、高通滤波器后对行方向降取样,可得到四张图。如图三所示

图三

图三从左至右、上至下分别对应到图二的,代表粗略次频带(approximation subband)、,表示水平的细节、,表示垂直方向的细节、,表示对角线方向的细节,即是角落(corner)的部分。若针对粗略子带继续经过更多次的低通、高通滤波器,便达到压缩的效果,最广泛的应用就是JPEG2000,其主要的算法小波转换的基本概念即是上面所述。

参考

  • sub-band coding tutorial https://web.archive.org/web/20070613152917/http://www.otolith.com/otolith/olt/sbc.html
  • Rafael C. Gonzalez, Richard E. Woods, "Digital Image Processing", 2nd 2002, ISBN 0-20-118075-8

显示全文

取消

感谢您的支持,我会继续努力的!

扫码支持
无需打赏可直接关闭阅读全文
1分,2分不嫌少,钱不钱的无所谓,重要的是你的话语激励我前行!

愿你每天温暖如春!!!


相关推荐