UTF-8 (8-
bit Unicode Transformation Format) is een manier om
Unicode/ISO 10646-tekens op te slaan als een stroom van
bytes, een zogenaamde
tekencodering. Het alternatief heet
UTF-16.UTF-8 is een tekencodering met een variabele lengte: niet elk teken gebruikt evenveel bytes. Afhankelijk van het teken worden tussen 1 en 4 bytes gebruikt. Voor het vastleggen van elk van de 128
ASCII-tekens is slechts één byte nodig.Hoewel het niet efficiënt lijkt om Unicodetekens in 4 bytes te moeten coderen, is het zo dat UTF-8 eenvoudig in gebruik is omdat de codering van een tekst met uitsluitend ASCII-tekens in ASCII en UTF-8 gelijk is.
Zie meer op Wikipedia.org...
tekenset voor XML, volgens UCS standaard; zie MSDN mei 00; zie ook UCS