Zum Hauptinhalt springen

12.3. Video Telephony, Interleaved Packetization Using NAL Unit Aggregation (Videotelefonie, verschachtelte Paketierung mit NAL-Aggregation)

12.3. Video Telephony, Interleaved Packetization Using NAL Unit Aggregation (Videotelefonie, verschachtelte Paketierung mit NAL-Unit-Aggregation)

Dieses Schema ermöglicht bessere Fehlerverdeckung (error concealment) und wird in H.263-basierten Entwürfen mit RFC-4629-Paketierung [11] verwendet. Es wurde implementiert, und gute Ergebnisse wurden berichtet [13].

Der VCL-Encoder codiert das Quellbild so, dass alle Makroblöcke (macroblock, MB) einer MB-Zeile einem Slice zugeordnet werden. Alle Slices mit geraden MB-Zeilenadressen werden zu einem STAP (Single-Time Aggregation Packet) zusammengefasst und alle mit ungeraden zu einem weiteren. Diese STAPs werden als RTP-Pakete übertragen. Die Einrichtung der Parametersätze erfolgt wie oben erörtert.

Beachten Sie, dass die Verwendung von STAPs hier wesentlich ist, da die hohe Anzahl einzelner Slices (18 für ein CIF-Bild (Common Intermediate Format)) zu inakzeptabel hohem IP/UDP/RTP-Kopfoverhead führen würde (sofern das Quellcodierwerkzeug FMO nicht verwendet wird, was in diesem Szenario nicht angenommen wird). Darüber hinaus nutzen einige drahtlose Videotransmissionssysteme wie H.324M und die in 3GPP spezifizierte IP-basierte Videotelefonie vermutlich relativ kleine Transportpaketgrößen. Beispielsweise liegt eine typische MTU-Größe des H.223-AL3-SDU bei etwa 100 Byte [17]. Die Codierung einzelner Slices gemäß diesem Paketierungsschema bietet weiteren Vorteil in der Kommunikation zwischen drahtgebundenen und drahtlosen Netzen, da einzelne Slices wahrscheinlich kleiner als die bevorzugte maximale Paketgröße drahtloser Systeme sind. Folglich kann ein Gateway die in einem drahtgebundenen Netz verwendeten STAPs in mehrere RTP-Pakete mit nur einer NAL-Unit umsetzen, die in einem drahtlosen Netz bevorzugt werden, und umgekehrt.