助听音频处理算法之宽动态范围压缩(WDRC)

宽动态范围压缩(Wide Dynamic Range Compression,简称WDRC)算法是数字助听器最核心的算法之一,其主要作用是对不同频率、不同强度的声音进行不同程度的补偿处理,从而将环境音转换到受损之后的听阈范围内,如下图所示:

broken image

WDRC 效果示意简图

原理简介

WDRC 基于频域实现,其流程为:对输入系统的音频时域信号进行分帧、WOLA分解(加窗、FFT)、划分通道、根据WDRC的输入输出曲线计算增益,在频带上应用增益、WOLA综合,输出至DAC播放。

注意,这里提到了“通道”的概念。WDRC 算法涉及到两个“通道”的概念

  • 信号处理通道数:音频信号FFT处理之后划分的通道,对每一个通道内的信号都需要计算处理;
  • 可调通道数(Channel):验配软件界面上支持调节的通道数;

对于助听器行业,“可调通道数”是少有的用户教育较好的指标,基本形成了“通道越多,助听器越好”的共识。注意,“通道越多”里的“通道”,指的是“可调通道数”的通道,而“信号处理通道数”更多是一个技术上的概念,并不对用户或验配师开放,因此无需关注。

然而近年来,不少行业玩家似乎在有意无意混淆“信号处理通道”和“可调通道数”的概念,特别是对于电商渠道销售的很多新产品。

WDRC 验配调参

经常在各种平台上看到有小伙伴想了解如何验配助听器,这里对WDRC部分的验配调参的设置项进行简单介绍。

所谓WDRC 调试,其实就是调整增益表(见下图)的值,这里结合下图进行介绍:

broken image

第一行,MPO:各个频率声音的最大声输出限制值,设定后助听器在这个频段最大也只能输出设定的声音强度,通常有UCL(不适阈)测试结果确定,避免助听器输出声音过大导致用户聆听不舒适、甚至对听力造成二次损伤;

  • 第二行,声音频率:图中的值为各个可调通道内声音频率的代表值(简单理解为通道内频率范围的中间值);
  • 第三/四/五行,G50/G65/G80:助听器麦克风拾取到的声音的强度值,分别对应小声、中声和大声;

常说的调试,就是根据用户的反馈来调整白色表格部分,特别是下面三行格子里的值,举几个例子:

  • 用户反馈小声说话听不到,那大致就应该G50(小声)一行调大一点,给更多的补偿;
  • 用户反馈堵耳严重,很闷,那大致就应该调小G50/G65/G80这三行前几列的值,也就是降低低频部分的增益.

 

参考资料:https://zhuanlan.zhihu.com/p/700106281