3. 定義 (Definitions)
RTPペイロード (RTP Payload): パケット内でRTPによって転送されるデータ。例えば、オーディオサンプルまたは圧縮ビデオデータ。ペイロードのフォーマットと解釈は、本文書の範囲外です。
RTPパケット (RTP Packet): 固定RTPヘッダー、空の可能性がある貢献ソースのリスト(下記参照)、およびペイロードデータで構成されるデータパケット。一部の基盤プロトコルでは、RTPパケットのカプセル化を定義する必要がある場合があります。通常、基盤プロトコルの1つのパケットには単一のRTPパケットが含まれますが、カプセル化方法で許可されている場合は複数のRTPパケットが含まれる場合があります(セクション11を参照)。
RTCPパケット (RTCP Packet): RTPデータパケットのものと類似した固定ヘッダー部分で構成される制御パケット。その後にRTCPパケットタイプに応じて変化する構造化要素が続きます。フォーマットはセクション6で定義されています。通常、複数のRTCPパケットは、基盤プロトコルの単一パケット内で複合RTCPパケットとして一緒に送信されます。これは、各RTCPパケットの固定ヘッダー内の長さフィールドによって可能になります。
ポート (Port): 「特定のホストコンピュータ内の複数の宛先を区別するためにトランスポートプロトコルが使用する抽象化。TCP/IPプロトコルは、小さな正の整数を使用してポートを識別します。」[12] OSIトランスポート層で使用されるトランスポートセレクタ (TSEL) はポートと同等です。RTPは、セッションのRTPおよびRTCPパケットを多重化するためのポートなどのメカニズムを提供するために、下位層プロトコルに依存します。
トランスポートアドレス (Transport Address): トランスポートレベルのエンドポイントを識別するネットワークアドレスとポートの組み合わせ。例えば、IPアドレスとUDPポート。パケットは、ソーストランスポートアドレスから宛先トランスポートアドレスに送信されます。
RTPメディアタイプ (RTP Media Type): 単一のRTPセッション内で伝送できるペイロードタイプのコレクション。RTPプロファイルは、RTPメディアタイプをRTPペイロードタイプに割り当てます。
マルチメディアセッション (Multimedia Session): 共通の参加者グループ間の同時RTPセッションのセット。例えば、ビデオ会議(マルチメディアセッション)には、オーディオRTPセッションとビデオRTPセッションが含まれる場合があります。
RTPセッション (RTP Session): RTPで通信する参加者のセット間の関連付け。参加者は、同時に複数のRTPセッションに関与する場合があります。マルチメディアセッションでは、エンコーディング自体が複数のメディアを単一のデータストリームに多重化しない限り、各メディアは通常、独自のRTCPパケットを持つ個別のRTPセッションで伝送されます。参加者は、異なる宛先トランスポートアドレスのペアを使用して異なるセッションを受信することにより、複数のRTPセッションを区別します。トランスポートアドレスのペアは、1つのネットワークアドレスとRTPおよびRTCP用のポートのペアで構成されます。
RTPセッションの特徴的な機能は、各セッションがSSRC識別子(次に定義)の完全で独立したスペースを維持することです。1つのRTPセッションに含まれる参加者のセットは、RTP内でSSRCまたはCSRC(以下にも定義)として、またはRTCP内で、参加者のいずれかによって送信されたSSRC識別子を受信できる参加者で構成されます。
同期ソース (SSRC - Synchronization Source): RTPパケットストリームのソース。ネットワークアドレスに依存しないように、RTPヘッダーで伝送される32ビット数値のSSRC識別子によって識別されます。同期ソースからのすべてのパケットは、同じタイミングとシーケンス番号スペースの一部を形成するため、受信者は再生のために同期ソースごとにパケットをグループ化します。同期ソースの例には、マイクやカメラなどの信号ソースから派生したパケットストリームの送信者、またはRTPミキサー(下記参照)が含まれます。
貢献ソース (CSRC - Contributing Source): RTPミキサー(下記参照)によって生成された結合ストリームに貢献したRTPパケットストリームのソース。ミキサーは、特定のパケットの生成に貢献したソースのSSRC識別子のリストを、そのパケットのRTPヘッダーに挿入します。このリストはCSRCリストと呼ばれます。
エンドシステム (End System): RTPパケットで送信されるコンテンツを生成するか、受信したRTPパケットのコンテンツを消費するアプリケーション。エンドシステムは、特定のRTPセッションで1つ以上の同期ソースとして機能できますが、通常は1つだけです。
ミキサー (Mixer): 1つ以上のソースからRTPパケットを受信し、データフォーマットを変更する可能性があり、何らかの方法でパケットを結合してから新しいRTPパケットを転送する中間システム。複数の入力ソース間のタイミングは一般的に同期されないため、ミキサーはストリーム間でタイミング調整を行い、結合ストリームに対して独自のタイミングを生成します。
トランスレータ (Translator): 同期ソース識別子をそのままにしてRTPパケットを転送する中間システム。トランスレータの例には、ミキシングなしでエンコーディングを変換するデバイス、マルチキャストからユニキャストへのレプリケータ、およびファイアウォール内のアプリケーションレベルフィルタが含まれます。
モニター (Monitor): RTPセッションの参加者によって送信されたRTCPパケット、特に受信レポートを受信し、配信監視、障害診断、および長期統計のための現在のサービス品質を推定するアプリケーション。
非RTP手段 (Non-RTP Means): 使用可能なサービスを提供するためにRTPに加えて必要となる可能性のあるプロトコルとメカニズム。特にマルチメディア会議の場合、制御プロトコルは、マルチキャストアドレスと暗号化のキーを配布し、使用する暗号化アルゴリズムをネゴシエートし、事前定義されたペイロードタイプ値を持たないフォーマットのペイロードフォーマットとRTPペイロードタイプ値間の動的マッピングを定義する場合があります。そのようなプロトコルの例には、セッション開始プロトコル (SIP) (RFC 3261 [13])、ITU勧告H.323 [14]、およびRTSP (RFC 2326 [16]) などのSDP (RFC 2327 [15]) を使用するアプリケーションが含まれます。