3. Definitionen (Definitions)

RTP-Nutzdaten (RTP Payload): Die von RTP in einem Paket übertragenen Daten, beispielsweise Audiosamples oder komprimierte Videodaten. Das Nutzdatenformat und die Interpretation liegen außerhalb des Geltungsbereichs dieses Dokuments.

RTP-Paket (RTP Packet): Ein Datenpaket, das aus dem festen RTP-Header, einer möglicherweise leeren Liste beitragender Quellen (siehe unten) und den Nutzdaten besteht. Einige zugrunde liegende Protokolle können erfordern, dass eine Kapselung des RTP-Pakets definiert wird. Typischerweise enthält ein Paket des zugrunde liegenden Protokolls ein einzelnes RTP-Paket, aber mehrere RTP-Pakete KÖNNEN enthalten sein, wenn die Kapselungsmethode dies zulässt (siehe Abschnitt 11).

RTCP-Paket (RTCP Packet): Ein Kontrollpaket, das aus einem festen Header-Teil ähnlich dem von RTP-Datenpaketen besteht, gefolgt von strukturierten Elementen, die je nach RTCP-Pakettyp variieren. Die Formate sind in Abschnitt 6 definiert. Typischerweise werden mehrere RTCP-Pakete zusammen als zusammengesetztes RTCP-Paket in einem einzelnen Paket des zugrunde liegenden Protokolls gesendet; dies wird durch das Längenfeld im festen Header jedes RTCP-Pakets ermöglicht.

Port: Die „Abstraktion, die Transportprotokolle verwenden, um zwischen mehreren Zielen innerhalb eines bestimmten Hostcomputers zu unterscheiden. TCP/IP-Protokolle identifizieren Ports unter Verwendung kleiner positiver Ganzzahlen." [12] Die von der OSI-Transportschicht verwendeten Transportselektoren (TSEL) sind äquivalent zu Ports. RTP hängt vom Protokoll der unteren Schicht ab, um einen Mechanismus wie Ports bereitzustellen, um die RTP- und RTCP-Pakete einer Sitzung zu multiplexen.

Transportadresse (Transport Address): Die Kombination aus einer Netzwerkadresse und einem Port, die einen Endpunkt auf Transportebene identifiziert, beispielsweise eine IP-Adresse und einen UDP-Port. Pakete werden von einer Quelltransportadresse zu einer Zieltransportadresse übertragen.

RTP-Medientyp (RTP Media Type): Ein RTP-Medientyp ist die Sammlung von Nutzdatentypen, die innerhalb einer einzelnen RTP-Sitzung übertragen werden können. Das RTP-Profil weist RTP-Medientypen RTP-Nutzdatentypen zu.

Multimedia-Sitzung (Multimedia Session): Eine Reihe gleichzeitiger RTP-Sitzungen zwischen einer gemeinsamen Gruppe von Teilnehmern. Beispielsweise kann eine Videokonferenz (die eine Multimedia-Sitzung ist) eine Audio-RTP-Sitzung und eine Video-RTP-Sitzung enthalten.

RTP-Sitzung (RTP Session): Eine Assoziation zwischen einer Gruppe von Teilnehmern, die mit RTP kommunizieren. Ein Teilnehmer kann gleichzeitig an mehreren RTP-Sitzungen beteiligt sein. In einer Multimedia-Sitzung wird jedes Medium typischerweise in einer separaten RTP-Sitzung mit eigenen RTCP-Paketen übertragen, es sei denn, die Codierung selbst multiplext mehrere Medien in einen einzigen Datenstrom. Ein Teilnehmer unterscheidet mehrere RTP-Sitzungen durch den Empfang verschiedener Sitzungen unter Verwendung verschiedener Paare von Zieltransportadressen, wobei ein Paar von Transportadressen eine Netzwerkadresse plus ein Paar von Ports für RTP und RTCP umfasst. Alle Teilnehmer einer RTP-Sitzung können ein gemeinsames Zieltransportadressenpaar teilen, wie im Fall von IP-Multicast, oder die Paare können für jeden Teilnehmer unterschiedlich sein, wie im Fall einzelner Unicast-Netzwerkadressen und Portpaare.

Das unterscheidende Merkmal einer RTP-Sitzung besteht darin, dass jede einen vollständigen, separaten Raum von SSRC-Identifikatoren verwaltet (als nächstes definiert). Die Gruppe der Teilnehmer, die in einer RTP-Sitzung enthalten sind, besteht aus denjenigen, die einen SSRC-Identifikator empfangen können, der von einem der Teilnehmer entweder in RTP als SSRC oder CSRC (ebenfalls unten definiert) oder in RTCP übertragen wird.

Synchronisationsquelle (SSRC - Synchronization Source): Die Quelle eines Stroms von RTP-Paketen, identifiziert durch einen 32-Bit-numerischen SSRC-Identifikator, der im RTP-Header übertragen wird, um nicht von der Netzwerkadresse abhängig zu sein. Alle Pakete von einer Synchronisationsquelle bilden Teil desselben Timing- und Sequenznummernraums, sodass ein Empfänger Pakete nach Synchronisationsquelle für die Wiedergabe gruppiert. Beispiele für Synchronisationsquellen umfassen den Sender eines Paketstroms, der von einer Signalquelle wie einem Mikrofon oder einer Kamera abgeleitet ist, oder einen RTP-Mixer (siehe unten). Eine Synchronisationsquelle kann ihr Datenformat im Laufe der Zeit ändern, z.B. Audiocodierung. Der SSRC-Identifikator ist ein zufällig gewählter Wert, der innerhalb einer bestimmten RTP-Sitzung global eindeutig sein soll (siehe Abschnitt 8). Ein Teilnehmer muss nicht denselben SSRC-Identifikator für alle RTP-Sitzungen in einer Multimedia-Sitzung verwenden; die Bindung der SSRC-Identifikatoren wird über RTCP bereitgestellt (siehe Abschnitt 6.5.1). Wenn ein Teilnehmer mehrere Ströme in einer RTP-Sitzung erzeugt, beispielsweise von separaten Videokameras, MUSS jeder als unterschiedlicher SSRC identifiziert werden.

Beitragende Quelle (CSRC - Contributing Source): Eine Quelle eines Stroms von RTP-Paketen, die zum kombinierten Strom beigetragen hat, der von einem RTP-Mixer produziert wurde (siehe unten). Der Mixer fügt eine Liste der SSRC-Identifikatoren der Quellen, die zur Erzeugung eines bestimmten Pakets beigetragen haben, in den RTP-Header dieses Pakets ein. Diese Liste wird als CSRC-Liste bezeichnet. Eine Beispielanwendung ist Audiokonferenz, bei der ein Mixer alle Sprecher angibt, deren Sprache kombiniert wurde, um das ausgehende Paket zu erzeugen, sodass der Empfänger den aktuellen Sprecher anzeigen kann, obwohl alle Audiopakete denselben SSRC-Identifikator enthalten (den des Mixers).

Endsystem (End System): Eine Anwendung, die den in RTP-Paketen zu sendenden Inhalt generiert und/oder den Inhalt empfangener RTP-Pakete verbraucht. Ein Endsystem kann in einer bestimmten RTP-Sitzung als eine oder mehrere Synchronisationsquellen fungieren, typischerweise jedoch nur als eine.

Mixer: Ein Zwischensystem, das RTP-Pakete von einer oder mehreren Quellen empfängt, möglicherweise das Datenformat ändert, die Pakete auf irgendeine Weise kombiniert und dann ein neues RTP-Paket weiterleitet. Da das Timing zwischen mehreren Eingangsquellen im Allgemeinen nicht synchronisiert ist, nimmt der Mixer Timing-Anpassungen zwischen den Strömen vor und generiert sein eigenes Timing für den kombinierten Strom. Somit werden alle Datenpakete, die von einem Mixer stammen, als solche identifiziert, die den Mixer als ihre Synchronisationsquelle haben.

Übersetzer (Translator): Ein Zwischensystem, das RTP-Pakete mit ihrem intakten Synchronisationsquellen-Identifikator weiterleitet. Beispiele für Übersetzer umfassen Geräte, die Codierungen ohne Mischung konvertieren, Replikatoren von Multicast zu Unicast und Filter auf Anwendungsebene in Firewalls.

Monitor: Eine Anwendung, die RTCP-Pakete empfängt, die von Teilnehmern in einer RTP-Sitzung gesendet werden, insbesondere die Empfangsberichte, und die aktuelle Dienstqualität für Verteilungsüberwachung, Fehlerdiagnose und Langzeitstatistiken schätzt. Die Monitor-Funktion ist wahrscheinlich in die an der Sitzung teilnehmende(n) Anwendung(en) integriert, kann aber auch eine separate Anwendung sein, die ansonsten nicht teilnimmt und die RTP-Datenpakete nicht sendet oder empfängt (da sie sich auf einem separaten Port befinden). Diese werden als Drittanbieter-Monitore bezeichnet. Es ist auch akzeptabel, dass ein Drittanbieter-Monitor die RTP-Datenpakete empfängt, aber keine RTCP-Pakete sendet oder anderweitig in der Sitzung gezählt wird.

Nicht-RTP-Mittel (Non-RTP Means): Protokolle und Mechanismen, die zusätzlich zu RTP benötigt werden können, um einen nutzbaren Dienst bereitzustellen. Insbesondere für Multimedia-Konferenzen kann ein Steuerprotokoll Multicast-Adressen und Schlüssel für die Verschlüsselung verteilen, den zu verwendenden Verschlüsselungsalgorithmus aushandeln und dynamische Zuordnungen zwischen RTP-Nutzdatentyp-Werten und den von ihnen dargestellten Nutzdatenformaten für Formate definieren, die keinen vordefinierten Nutzdatentyp-Wert haben. Beispiele für solche Protokolle umfassen das Session Initiation Protocol (SIP) (RFC 3261 [13]), ITU-Empfehlung H.323 [14] und Anwendungen, die SDP (RFC 2327 [15]) verwenden, wie RTSP (RFC 2326 [16]). Für einfache Anwendungen können auch E-Mail oder eine Konferenzdatenbank verwendet werden. Die Spezifikation solcher Protokolle und Mechanismen liegt außerhalb des Geltungsbereichs dieses Dokuments.