Logaholic.de

Avatar

queer as code!

UTF-8 Encoding – Rekursive Näherung

Wer kennt es nicht, eine Datenbank gefüllt mit verschiedenartig kodierten Daten. Einmal ISO, einmal UTF-8, und mit Sicherheit auch mehrfach UTF-8 kodiertes…

Gestern habe ich ein relativ einfaches Prinzip verfolgt, was mir unerwartet gute Ergebnisse liefert. Alle Daten, die einem der oben genannten Muster entsprechen, nimmt das Konstrukt auf und gibt es als korrekten (nur einfach) kodierten UTF-8 String zurück.

[Read more]

Charsets, Encodings und sonstiger UTF-8 Kram

Ja, ich gehöre zu den Menschen (äh, Codern..) die bei “Umlaut-Problemen” erstmal zusammenzucken. Gefolgt von einem kalten Schauer wartet man genervt, auf welche unmögliche “Leistung” der Vorgänger im aktuellen Projekt (was Charset und Encoding angeht) man diesmal wieder hingewiesen wird…

Eine schöne Zusammenfassung zu dieser Thematik haben wir hier gefunden:

Link zum Artikel

,