Tartalomjegyzék:
- Meghatározás - Mit jelent a Unicode Transformation Format (UTF)?
- A Techopedia magyarázza az Unicode Transformation Format (UTF) formátumot
Meghatározás - Mit jelent a Unicode Transformation Format (UTF)?
A Unicode Transformation Format (UTF) egy karakterkódoló formátum, amely képes az Unicode összes lehetséges karakterkódpontját kódolni. A legtermékenyebb az UTF-8, amely egy változó hosszúságú kódolás és 8 bites kód egységeket használ, amelyeket az ASCII kódolással való visszamenőleges kompatibilitásra terveztek.
A Unicode átalakítási formátumot univerzális átalakítási formátumnak is nevezik.
A Techopedia magyarázza az Unicode Transformation Format (UTF) formátumot
A Unicode Transformation Format az Unicode-ban használt két kódolás egyike, a másik az Universal Character Set (UCS). Mindkettőt arra használják, hogy az Unicode kódpontok tartományát leképezzék úgynevezett kód értékek sorozataiba. A kódolás nevében szereplő számok azt jelzik, hogy hány bit kerül felhasználásra a kódolás egy kódértékében. Ez egyszerűen azt jelenti, hogy minden egyedi karakterhez hozzárendelnek egy kód azonosítót, amelyet kódpontoknak hívnak.
Az UTF kódolások különféle típusai a következők:
- UTF-1 - az UTF-8 nyugdíjas elődje, amely már nem része a Unicode szabványnak
- UTF-7 - 7 bites kódolást használ, és elsősorban e-mailben használták, de ma már elavultnak tekintik
- UTF-8 - 8 bites változó szélességű kódolást használ az ASCII-vel való kompatibilitás maximalizálása érdekében
- UTF-16 - 16 bites változó szélességű kódolás
- UTF-32 - 32 bites rögzített szélességű kódolás
- UTF-EBCIDC - 8 bitet használ és úgy tervezték, hogy kompatibilisek legyenek a kiterjesztett bináris kódolású decimális cserélő kóddal (EBCDIC)