Unicode è un sistema di codifica che assegna un numero (o meglio, una combinazione di
bit) a ogni carattere in maniera indipendente dal
programma, piattaforma e dalla
lingua (e dal suo sistema di scrittura).Unicode si basa sulla codifica ISO/IEC 8859-1 (o ISO Latin-1, nota anche col nomignolo ASCII esteso, che indica però molte altre codifiche a 8 bit basate sul vecchio standard
ASCII), che consentiva la rappresentazione di 256 caratteri ed era sufficiente per gli alfabeti dell'Europa Occidentale e del Nord America.Unicode va molto oltre, codificando i caratteri usati in quasi tutte le lingue vive e in alcune lingue morte, nonché simboli matematici e chimici, cartografici, l'alfabeto Braille, ideogrammi etc. L'ASCII, l'ISO/IEC 8859-1, e tutte le altre codifiche precedentemente in uso, non possedevano un numero di caratteri sufficienti per tutte le lingue e per le necessità di comunicazione in qualsiasi ambito disciplinare. Per ciascuna esigenza, era necessario utilizzare una codifica apposita, molto spesso proprietaria.
Per saperne di più visita Wikipedia.org...
codifica per rappresentare caratteri in una stringa. Ciascun carattere unicode e' rappresentato da 16 bit, quindi si ha un intervallo di carattere da 0 a 65536 (216). L'Unicode unifica molti alfabeti, quello latino, greco, ebraico, arabo, cirillico, il katakhana, l'hanguel, etc. Vedi anche il set di caratteri
ASCII (7 bit, 128 caratteri),
ISO-Latin-1 (8 bit, 256 caratteri).