Warum wird in MySQL keine UTF-8-Kodierung verwendet?

Warum wird in MySQL keine UTF-8-Kodierung verwendet?

MySQL UTF-8-Kodierung

MySQL unterstützt UTF-8 seit Version 4.1 (im Jahr 2003), der derzeit gängige UTF-8-Standard (RFC 3629) wurde jedoch erst danach spezifiziert. Aus diesem Grund ist das UTF-8 in MySQL nicht konsistent mit dem UTF-8 in unserer täglichen Entwicklung, was zu einigen Problemen führt. MySQLs UTF-8 unterstützt nur bis zu drei Bytes pro Zeichen, während echtes UTF-8 bis zu vier Bytes pro Zeichen unterstützt.

Reproduktion des Problems

Die Datenbanktabelle sieht wie folgt aus: utf8-Kodierung

Fügen Sie der Datenbank einen Datensatz hinzu:

@Prüfen
öffentliche void testInsert() {
 Benutzer Benutzer = neuer Benutzer();
 Benutzer.setUsername("\uD83D\uDE00 ");
 Benutzer.setPassword("123456");
 userRepo.save(Benutzer);
}

Dies ist nur ein Teil des Codes. Es ist nicht schlimm, wenn Sie ihn nicht verstehen. Hier wird ein Datensatz in die Benutzertabelle eingefügt. Wobei der Benutzername \uD83D\uDE00 ist.

Tatsächlich ist \uD83D\uDE00 ein Emoji.

Da der UTF-8-Zeichensatz in MySQL nur den Unicode-Bereich der drei Byte langen UTF-8-Kodierung unterstützt und Emoji-Zeichen zum vier Byte langen Kodierungsteil gehören, meldet das Programm bei der erwartungsgemäßen Ausführung einen Fehler. Führen Sie diesen Code aus:

Wie erwartet wurde ein Fehler gemeldet.

Lösung des Problems

Obwohl MySQLs UTF-8 Mängel aufweist, haben die Verantwortlichen von MySQL (einschließlich MariaDB) diesen Fehler nicht behoben. Stattdessen wurde echtes UTF-8 durch die 2010 neu veröffentlichte Version „utf8mb4“ unterstützt. Wenn Sie dieses Problem lösen möchten, können Sie die MySQL-Datenbank nur auf den Zeichensatz utf8mb4 einstellen.

Zusammenfassen

Dieses Problem wurde entdeckt, weil beim Speichern der Daten ein Emoji-Ausdruck gespeichert wurde. Tatsächlich entdeckte ich utf8mb4, als ich begann, MySQL zu verwenden, verstand aber den Unterschied zwischen UTF8 und UTF8MB4 nicht. Nachdem ich diese Lektion gelernt habe, werde ich bei zukünftiger Verwendung von MySQL den Zeichensatz auf utf8mb4 einstellen.

Das ist alles für diesen Artikel. Ich hoffe, dass der Inhalt dieses Artikels für Ihr Studium oder Ihre Arbeit von gewissem Referenzwert ist. Vielen Dank für Ihre Unterstützung von 123WORDPRESS.COM.

Das könnte Sie auch interessieren:
  • So legen Sie die UTF-8-Kodierung in einer MySQL-Datenbank fest
  • MySQL GBK → UTF-8-Kodierungskonvertierung
  • Warum wird UTF-8 in MySQL nicht empfohlen?

<<:  So vergessen Sie das Passwort von Jenkins in Linux

>>:  WeChat-Applet-Picker - Mehrspalten-Selektor (Modus = MultiSelector)

Artikel empfehlen

js Array-Einträge () Holen Sie sich die Iterationsmethode

Inhaltsverzeichnis 1. Detaillierte Syntax der Met...

Verwenden von CSS3 zum Erstellen von Header-Animationseffekten

Die offizielle Website von Netease Kanyouxi (http...

Die häufigsten Fehler beim Schreiben von HTML-Tags

Wir sollten besser aufpassen, denn die HTML-Poliz...

Details zur Verwendung von Bimface in Vue

Inhaltsverzeichnis 1. Installieren Sie das Vue-Ge...

Reines js, um einen Schreibmaschineneffekt zu erzielen

In diesem Artikelbeispiel wird der spezifische Co...

So unterstützen Sie vollständiges Unicode in MySQL/MariaDB

Inhaltsverzeichnis Einführung in utf8mb4 Fehler b...

Fehlereinfügungsanalyse der Funktion „updatexml()“ von MySQL

Verstehen Sie zunächst die Funktion updatexml() U...

Prinzipien der MySQL-Datentypoptimierung

MySQL unterstützt viele Datentypen und die Auswah...

So verwenden Sie Linux-Befehle in IDEA

Im Vergleich zum Windows-System bietet das Linux-...

Bootstrap 3.0 Studiennotizen Grid-System-Fall

Vorwort Im vorherigen Artikel haben wir hauptsäch...