4. Audio Level (音声レベル)
ユーザーが手動で再生を調整する必要を避け、会議アプリケーションでのミキシングを容易にするために、音声伝送の「回線上」の音声レベルを標準化することが望ましいです。また、アクティブ音声レベルを-19 dBm0と推奨するITU-T勧告G.169およびG.115と一致させることも望ましいです。ただし、G.169およびG.115とは異なり、WebRTCの音声はG.712で指定される通過帯域を持つことに制約されず、実際には8から48 kHzおよびそれ以上の任意のサンプリングレートでサンプリングできます。このため、使用するサンプリングレートに関係なく、300 Hz以上の周波数のみを考慮することでレベルを正規化すべきです (SHOULD)。レベルはまた、クリッピングを避けるために調整すべきです (SHOULD)。これは、ゲインを-19 dBm0以下のレベルに下げるか、コンプレッサーを使用することで実現できます。
線形16ビットPCMで値が+/-32767であると仮定すると、-19 dBm0は二乗平均平方根 (root mean square, RMS) レベル2600に対応します。RMS計算ではアクティブ音声のみを考慮すべきです。エンドポイントがオーディオキャプチャパス全体を制御している場合(通常の電話の典型的なケース)、平均的な話者のアクティブ音声のレベルが2600 (-19 dBm0) になるようにゲインを調整することが推奨されます (RECOMMENDED)。エンドポイントがオーディオキャプチャ全体を制御していない場合(ソフトウェアエンドポイントの典型的なケース)、エンドポイントは自動ゲイン制御 (Automatic Gain Control, AGC) を使用して、レベルを2600 (-19 dBm0) +/- 6 dBに動的に調整すべきです (SHOULD)。音楽またはデスクトップ共有アプリケーションの場合、レベルは自動的に調整すべきでなく (SHOULD NOT)、エンドポイントはユーザーが手動でゲインを設定できるようにすべきです (SHOULD)。
信号エネルギーを正規化するために推奨される (RECOMMENDED) フィルターは、カットオフ周波数300 Hzの2次バタワースフィルタ (second-order Butterworth filter) です。
一部のデバイスのオーディオ出力は、通常、事前録音された「商用」音楽の再生用に「キャリブレーション」されており、これは通常、本セクションで推奨されるレベルよりも約12 dB大きいです。このため、エンドポイントは再生前にゲインを増加させてもよい (MAY) です。