12.3. Video Telephony, Interleaved Packetization Using NAL Unit Aggregation (ビデオテレフォニー, NAL ユニット集約を用いたインターリーブパケット化)
12.3. Video Telephony, Interleaved Packetization Using NAL Unit Aggregation (ビデオテレフォニー, NAL ユニット集約を用いたインターリーブパケット化)
本方式は誤り隠蔽 (error concealment) を改善し, RFC 4629 パケット化 [11] を用いる H.263 ベースの設計で採用されている。実装され, 良好な結果が報告されている [13]。
VCL エンコーダはソース画像を符号化し, 1 つの MB ライン上のすべてのマクロブロック (macroblock, MB) を 1 つのスライスに割り当てる。偶数 MB 行アドレスのスライスはすべて 1 つの STAP (Single-Time Aggregation Packet) にまとめられ, 奇数 MB 行アドレスのスライスは別の STAP にまとめられる。これらの STAP が RTP パケットとして送信される。パラメータセットの確立は上で述べたとおりに行われる。
ここでは STAP の使用が不可欠であることに注意する。個別スライスの数が多い (共通中間フォーマット (Common Intermediate Format, CIF) 画像では 18) と, 受け入れがたいほど IP/UDP/RTP ヘッダオーバーヘッドが大きくなる (ソース符号化ツール FMO を用いない限り, 本シナリオでは想定しない)。さらに, H.324M や 3GPP で規定される IP ベースのビデオテレフォニーなど, 一部の無線ビデオ伝送システムは比較的小さなトランスポートパケットサイズを用いる可能性がある。例えば, H.223 AL3 SDU の典型的な MTU サイズは約 100 バイトである [17]。本パケット化方式に従って個々のスライスを符号化すると, 有線と無線ネットワーク間の通信でさらに有利になる。個々のスライスは無線システムの好ましい最大パケットサイズより小さい可能性が高い。したがって, ゲートウェイは有線ネットワークで用いられる STAP を, 無線ネットワークで好まれる NAL ユニット 1 個だけの複数の RTP パケットに変換でき, その逆も可能である。