Kreuvfs Allerweltsblog

2012-11-22

UTF-8 für Kreuvfs Allerweltsblog

Abgelegt unter In eigener Sache von Kreuvf um 14:54:28

Nachdem ich vor ein oder zwei Jahren schon einmal versucht hatte endlich weg von der Zeichenkodierung ISO-8859-15 hin zu UTF-8 zu kommen, habe ich mich davon erst mal entnervt abgewendet.

Doch, ISO-8859-15 wird ja nicht besser mit der Zeit. Und da WordPress auch intern auf UTF-8 gesetzt hat, gab es hässlichen Zeichensalat bei der Verwendung der deutschen Übersetzung.

Ich habe also versucht aus der offiziellen Dokumentation herauszufinden wie man Datenbankzeichensätze konvertiert. Wie vorgeschlagen habe ich nicht an der Live-DB gearbeitet, sondern mir eine gesonderte gemacht.

An und für sich hat alles so funktioniert wie es in der Drei-Schritt-Anleitung beschrieben war. Nur gab es einen kleinen Nebeneffekt: die Texte wurden ab dem ersten Auftreten eines Nicht-ASCII-Zeichen wie zum Beispiel Umlaute oder „ß“ einfach abgeschnitten. So konvertieren kann ich auch per Hand~

Nach insgesamt 4 h des erfolglosen Rumprobierens habe ich eine andere Methode benutzt. Statt auf SQL-Magie zu vertrauen, habe ich einfach den ohnehin in UTF-8 vorliegenden Dump genommen, „latin1“ durch „utf8“ im gesamten Dump ausgetauscht und den Dump in die Datenbank importiert.

Das Ergebnis war eine vollständige Konversion zu UTF-8. *seufz* Warum nicht gleich so? >.<