![]() |
| Il carattere sostitutivo UTF-8 per le codifiche errate |
Quante volte capita di vedere nei propri progettini PHP il carattere nell'immagine qui accanto? Oppure dei caratteri accentati che nulla hanno a che vedere con le stringhe che ci si aspetta di visualizzare?
Di norma è solo un problema di charset. Già ma cos'è un charset?
Ogni carattere presente sullo schermo ha necessità di essere rappresentato nel computer sotto forma di una sequenza di bit. Se si pensasse ad un carattere, o glifo inteso come rappresentazione grafica di un elemento, come un disegno inserito in una matrice di punti 8x8, avremmo che ogni carattere è composto da 64 punti per ognuno dei quali dovremmo indicare se acceso o spento (0 o 1 ossia 1 bit). Ogni carattere sarebbe rappresentato da 8 byte. Un'enormità per un solo carattere! La cosa è ben peggiore se si considera che i font attualmente utilizzati dai PC di tipo true type, sono disegnati tramite una breve sequenza d'istruzioni che descrivono il carattere stesso permettendone il disegno a diverse dimensioni senza perdere in definizione.











