1. Introduzione (Introduction)
ISO/IEC 10646 definisce un grande insieme di caratteri chiamato Universal Character Set (UCS). Lo stesso insieme di caratteri è definito dallo standard Unicode, che definisce inoltre proprietà aggiuntive dei caratteri e altri dettagli applicativi di grande interesse per gli implementatori.
Forme di codifica
ISO/IEC 10646 e Unicode definiscono diverse forme di codifica del loro repertorio comune: UTF-8, UCS-2, UTF-16, UCS-4, UTF-32.
Caratteristiche di UTF-8
UTF-8 ha un'unità di codifica di un byte. Utilizza tutti i bit di un byte, ma ha la qualità di preservare l'intero intervallo US-ASCII.
Collegamenti correlati
- Torna alla pagina principale RFC 3629
- Successivo: 2. Convenzioni di notazione