TobiW Geschrieben März 23, 2014 Geschrieben März 23, 2014 Hallo Forum, zunächst mal ist der Artikel The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!) von Joel on Software für einige hier nicht uninteressant, aber er hat bei mir auch eine Frage aufgeworfen: Habe ich es richtig verstanden, dass UTF-8 die modernere Technik ist, weil sie eben gerade nur 8bit braucht. Viele Grüße Tobi
Þorsten Geschrieben März 23, 2014 Geschrieben März 23, 2014 Habe ich es richtig verstanden, dass UTF-8 die modernere Technik ist, weil sie eben gerade nur 8bit braucht. Mmm, nicht so ganz? Der Clou an UTF-8 ist der variable Platzbedarf: 1 Byte pro Zeichen für ASCII, 2 Byte für die meisten europäischen Sprachen (die mehr brauchen als nur ASCII), 3 Byte für wichtige europäische Neuzugänge (z.B. €, ẞ ) sowie die wichtigsten Zeichen anderer Weltsprachen incl. Chinesisch/Japanisch/Koreanisch und 4 Byte für CJK-Erweiterungen, obskure/ausgestorbene Sprachen, lange Listen von Emoticons und sonstigen Kram. Und ob UTF-8 mit seinen über 20 Jahren wirklich modern ist? Klar ist, dass es mittlerweile die populärste Kodierung im Web ist. Oft ist es mittlerweile auch die unkomplizierteste in anderen Kontexten. 1
Empfohlene Beiträge
Erstelle ein Benutzerkonto oder melde dich an, um zu kommentieren
Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können
Benutzerkonto erstellen
Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!
Neues Benutzerkonto erstellenEinloggen
Du hast bereits ein Benutzerkonto? Melde dich hier an.
Jetzt anmelden