Passa al contenuto principale

1. Introduzione (Introduction)

ISO/IEC 10646 definisce un grande insieme di caratteri chiamato Universal Character Set (UCS). Lo stesso insieme di caratteri è definito dallo standard Unicode, che definisce inoltre proprietà aggiuntive dei caratteri e altri dettagli applicativi di grande interesse per gli implementatori.

Forme di codifica

ISO/IEC 10646 e Unicode definiscono diverse forme di codifica del loro repertorio comune: UTF-8, UCS-2, UTF-16, UCS-4, UTF-32.

Caratteristiche di UTF-8

UTF-8 ha un'unità di codifica di un byte. Utilizza tutti i bit di un byte, ma ha la qualità di preservare l'intero intervallo US-ASCII.


Collegamenti correlati