4. Ordre des octets, alignement et format de temps (Byte Order, Alignment, and Time Format)
Tous les champs entiers sont transportés dans l'ordre des octets réseau, c'est-à-dire l'octet le plus significatif en premier. Cet ordre des octets est communément appelé big-endian. L'ordre de transmission est décrit en détail dans [3]. Sauf indication contraire, les constantes numériques sont en décimal (base 10).
Toutes les données d'en-tête sont alignées sur leur longueur naturelle, c'est-à-dire que les champs de 16 bits sont alignés sur des décalages pairs, les champs de 32 bits sont alignés sur des décalages divisibles par quatre, etc. Les octets désignés comme remplissage ont la valeur zéro.
L'heure d'horloge murale (date et heure absolues) est représentée en utilisant le format d'horodatage du protocole de temps réseau (Network Time Protocol, NTP), qui est en secondes par rapport à 0h UTC le 1er janvier 1900 [4]. L'horodatage NTP à résolution complète est un nombre à virgule fixe non signé de 64 bits avec la partie entière dans les 32 premiers bits et la partie fractionnaire dans les 32 derniers bits. Dans certains champs où une représentation plus compacte est appropriée, seuls les 32 bits du milieu sont utilisés ; c'est-à-dire les 16 bits inférieurs de la partie entière et les 16 bits supérieurs de la partie fractionnaire. Les 16 bits supérieurs de la partie entière doivent être déterminés indépendamment.
Une implémentation n'est pas tenue d'exécuter le protocole de temps réseau pour utiliser RTP. D'autres sources de temps, ou aucune du tout, peuvent être utilisées (voir la description du champ d'horodatage NTP dans la Section 6.4.1). Cependant, l'exécution de NTP peut être utile pour synchroniser les flux transmis à partir d'hôtes séparés.
L'horodatage NTP se réinitialisera à zéro à un moment donné de l'année 2036, mais aux fins de RTP, seules les différences entre les paires d'horodatages NTP sont utilisées. Tant que les paires d'horodatages peuvent être supposées être à moins de 68 ans l'une de l'autre, l'utilisation de l'arithmétique modulaire pour les soustractions et les comparaisons rend le réenroulement sans pertinence.