Skip to main content

4. Audio Level (音频电平)

为了避免用户必须手动调整播放并促进会议应用程序中的混音,标准化语音传输的 "线上" 音频电平是可取的。与ITU-T建议G.169和G.115保持一致也是可取的,它们推荐活动音频电平为-19 dBm0。但是,与G.169和G.115不同,WebRTC的音频不限于具有G.712指定的通带,实际上可以以从8到48 kHz及更高的任何采样率进行采样。因此,无论使用何种采样率,应该 (SHOULD) 通过仅考虑300 Hz以上的频率来标准化电平。电平还应该 (SHOULD) 进行调整以避免削波,可以通过将增益降低到-19 dBm0以下的电平或使用压缩器来实现。

假设线性16位PCM的值为+/-32767,-19 dBm0对应于均方根 (root mean square, RMS) 电平2600。在RMS计算中应仅考虑活动语音。如果端点控制整个音频捕获路径,如常规电话的典型情况,则推荐 (RECOMMENDED) 以这样的方式调整增益,使得普通说话者的活动语音电平为2600 (-19 dBm0)。如果端点不控制整个音频捕获路径,如软件端点的典型情况,则端点应该 (SHOULD) 使用自动增益控制 (Automatic Gain Control, AGC) 动态调整电平到2600 (-19 dBm0) +/- 6 dB。对于音乐或桌面共享应用程序,电平不应该 (SHOULD NOT) 自动调整,端点应该 (SHOULD) 允许用户手动设置增益。

推荐 (RECOMMENDED) 用于标准化信号能量的滤波器是截止频率为300 Hz的二阶巴特沃斯滤波器 (second-order Butterworth filter)。

某些设备上的音频输出通常被 "校准" 用于播放预录的 "商业" 音乐,这通常比本节中推荐的电平大约大12 dB。因此,端点可以 (MAY) 在播放前增加增益。