Schnellnavigation:

Kategorien

« März 2024»
S M T W T F S
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            

Letzte Nachrichten

DSGVO
26.05.2018 18:39
Trackingtools und Datenschutzerklärung
14.03.2014 23:07
1:n und n:1 Relationen in Extbase
06.12.2013 12:04
Erste Abmahnungen wegen Google Analytics
04.10.2013 12:11

Kopieren Sie diesen Link in Ihren RSS-Reader

RSS 0.91Nachrichten
RSS 2.0Nachrichten

In eigener Sache

Peter Linzenkirchner, Lisardo EDV Beratung in Augsburg. Freelance und Partner für Design- und Webagenturen in Augsburg und München. Pixelgenaue Templates, valides HTML, barrierearm. TYPO3-Projekte, Extension-Programmierung und mehr ... 

Zur Zeit wird gefiltert nach: mysql
Filter zurücksetzen

Achtung: Keine Gewähr: bei mir hat das folgende geklappt, aber es hängt stark von der Konfiguration von PhpMyAdmin ab! Das muss nämlich bereits korrekt auf utf-8 konfiguriert sein (was allerdings bei neuen Verisionen der Fall sein sollte). Siehe unten die beiden Links für eine Version, die sicherer funktioniert, aber leider Shell-Zugriff benötigt.

Ziel ist die Umstellung einer vorhandenen Installation in ISO-8859-1 nach utf-8. Dazu sind eine Reihe von Schritten nötig:

  • mit PhpMyAdmin die Datenbank exportieren. PhpMyAdmin erstellt dabei standardmäßig eine Datei in utf-8; heisst, die Daten sind bereits konvertiert.
  • neue DB anlegen und dabei darauf achten, dass die neue DB eine Collation von utf8_general_ci bekommt. Notfalls nachträglich in PhpMyAdmin in der Karteikarte »Operationen« umstellen.
  • Die exportiere SQL-Datei in einem Editor öffnen und dort die Einträge “DEFAULT CHARSET=latin1” entfernen.Achtung: bei mir gab es ein Problem mit der Tabelle »tx_realurl_pathcache« – beim Import erhielt ich eine Fehlermeldung, dass der Schlüssel länger wäre als 1000 Zeichen, was nicht erlaubt ist. Das liegt an der Umstellung auf utf-8: durch die benötigten 2 – 3 Byte pro Zeichen wird der Schlüssel zu lang. Ich habe deshalb bei dieser Tabelle “DEFAULT CHARSET=latin1” gelassen.
  • Danach die Datei mit PhpMyAdmin importieren. Wenn alles richtig eingestellt ist, werden die Daten jetzt als utf-8 eingelesen. Das kann kontrolliert werden mit einer kleinen PHP-Datei:

  1. $db_link=mysql_connect(db_url,db_user,db_passwort);
  2. $names=mysql_query('set names utf8');
  3. $db_sel=mysql_select_db(db_name) or die("Auswahl der Datenbank fehlgeschlagen");
  4. $sql="SELECT * FROM pages";
  5. echo'<table border="1">';
  6. while ($zeile=mysql_fetch_array($db_erg,MYSQL_ASSOC))
  7. {
  8.   echo"<tr>";
  9.   echo"<td>".$zeile['uid']."</td>";
  10.   echo"<td>".$zeile['title']."</td>";
  11.   echo"</tr>";
  12. }
  13. echo"</table>";

Den Output überprüfen, indem die Kodierung im Browser entsprechend umgestellt wird (oder denOutput mit einem HTML-Header erweitern und ein charset mitgeben). Entscheidend ist diese Zeile:

  1. $names=mysql_query('set names utf8');

sie stellt nämlich die Collation der Verbindung auf utf-8 um, die sonst standardmäßig auf latin stehen würde. Jetzt müssten alle Seitennamen korrekt in utf-8 im Browser erscheinen und PhpMyAdmin müsste sie ebenfalls korrekt anzeigen. Ohne Umstellen der Verbindung würde PhpMyAdmin zwar korrekt utf-8 in die Datenbank schreiben, wir würden aber mit PHP immer noch latin auslesen.

Der Witz ist, dass jetzt wirklich diese Testdatei und PhpMyAdmin die korrekten Zeichen anzeigen müssen!

Allerdings klappt es in TYPO3 noch nicht. Nächster Schritt:

  • Im Installtool muss bei [forceCharset] “utf-8” und bei [setDBInit] “set names utf8” eingetragen werden. Der erste Eintrag sorgt dafür, dass das Backend und die Frontendausgabe immer auf utf-8 eingestellt sind und die zweite Angabe stellt die Kollation der Datenbankverbindung auf utf-8. Insbesondere der zweite Eintrag ist nötig, sonst erhält TYPO3 durch die falsche Standardkollation der Verbindung (latin) doch keine utf-8-Daten.

Weiterführende Links

  • UTF-8-Umstellung (Großen Dank an Oliver, der Tipp mit [setDBInit] war der entscheidende Hinweis nach einigen Stunden Suche).
  • MySQL: Zeichensatz-Grundlagen – Der ausführlichste Artikel zum Problem der Zeichensätze in MySQL. Köhntopp rät allerdings von einer Umstellung der gesamten Datenbank auf UTF-8 ab und begründet das auch überzeugend mit Speicher- und Performance-Vorteilen. Allerdings erfordert sein Ansatz sehr genaues Arbeiten – Definition von CHARSET und COLLATION auf Spaltenebene.

 

 

Kategorien: API/Sonstiges  Kommentare 0
Tags: mysql, php, datenbank