Wie MLSQL Stack das Stream-Debugging vereinfacht

Vorwort

Ein Klassenkamerad untersucht die Streaming-Unterstützung von MLSQL Stack. Dann sagte ich, dass die Flow-Debugging-Funktion eigentlich ziemlich schwierig ist. Durch Übung hoffen wir, die folgenden drei Punkte zu erreichen:

Möglichkeit, jederzeit die neueste feste Anzahl von Kafka-Daten anzuzeigen
Debug-Ergebnisse (Sink) können auf der Web-Konsole ausgedruckt werden
Streaming-Programme können automatisch auf das JSON-Schema schließen (Spark kann dies derzeit nicht)

Nachdem ich diese drei Punkte umgesetzt hatte, stellte ich fest, dass das Debuggen viel einfacher wurde.

Verfahren

Zuerst habe ich eine kaf_write.mlsql-Datei erstellt, um das Schreiben von Daten in Kafka zu erleichtern:

setze abc='''
{ "x": 100, "y": 200, "z": 200 ,"dataType":"A-Gruppe"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B-Gruppe"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B-Gruppe"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B-Gruppe"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B-Gruppe"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B-Gruppe"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B-Gruppe"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B-Gruppe"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B-Gruppe"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B-Gruppe"}
{ "x": 120, "y": 100, "z": 260 ,"dataType":"B-Gruppe"}
''';
lade jsonStr.`abc` als Tabelle1;

Wählen Sie to_json(struct(*)) als Wert aus Tabelle1 als Tabelle2;
Speichern Sie „Anhängen von Tabelle2“ als „kafka.`wow`“, wobei 
kafka.bootstrap.servers="127.0.0.1:9092";

Auf diese Weise können die Daten bei jedem Ausführen in Kafka geschrieben werden.

Dann muss ich nach dem Schreiben sehen, ob die Daten wirklich eingetragen sind und wie sie aussehen:

!kafkaTool sampleData 10 Datensätze von „127.0.0.1:9092“ wow;

Dieser Satz bedeutet, dass ich 10 Kafka-Daten von Kafka abtasten möchte. Die Adresse von Kafka ist 127.0.0.1:9092 und das Thema ist wow. Die laufenden Ergebnisse sind wie folgt:

Es gibt kein Problem. Dann habe ich ein sehr einfaches Streaming-Programm geschrieben:

-- der Streamname sollte eindeutig sein.
setze streamName="streamExample";

-- verwenden Sie kafkaTool, um das Schema aus Kafka abzuleiten
!kafkaTool registerSchema 2 Datensätze von „127.0.0.1:9092“ wow;


Lade die Optionen von kafka.`wow` 
kafka.bootstrap.servers="127.0.0.1:9092"
als newkafkatable1;


Wählen Sie * aus newkafkatable1
als Tabelle21;


-- Drucken in der Webkonsole statt in der Terminalkonsole.
speichern anhängen table21 
als Webkonsole.`` 
Optionsmodus="Anhängen"
und Dauer="15"
und checkpointLocation="/tmp/s-cpl4";

Die Ergebnisse sind wie folgt:

Wir können den Echtzeiteffekt auch im Terminal sehen.

Auffüllen

Natürlich bietet MLSQL Stack noch zwei weitere großartige Features für das Streaming. Erstens können Sie HTTP-Protokoll-Callbacks für Streaming-Ereignisse festlegen und Batch-SQL verwenden, um die Streaming-Ergebnisse zu verarbeiten und sie schließlich in der Datenbank zu speichern. Siehe das folgende Skript:

-- der Streamname sollte eindeutig sein.
setze streamName="streamExample";


- einige Daten verspotten.
Daten festlegen='''
{"Schlüssel": "ja", "Wert": "nein", "Thema": "Test", "Partition": 0, "Offset": 0, "Zeitstempel": "2008-01-24 18:01:01.001", "Zeitstempeltyp": 0}
{"Schlüssel": "ja", "Wert": "nein", "Thema": "Test", "Partition": 0, "Offset": 1, "Zeitstempel": "2008-01-24 18:01:01.002", "Zeitstempeltyp": 0}
{"Schlüssel": "ja", "Wert": "nein", "Thema": "Test", "Partition": 0, "Offset": 2, "Zeitstempel": "2008-01-24 18:01:01.003", "Zeitstempeltyp": 0}
{"Schlüssel": "ja", "Wert": "nein", "Thema": "Test", "Partition": 0, "Offset": 3, "Zeitstempel": "2008-01-24 18:01:01.003", "Zeitstempeltyp": 0}
{"Schlüssel": "ja", "Wert": "nein", "Thema": "Test", "Partition": 0, "Offset": 4, "Zeitstempel": "2008-01-24 18:01:01.003", "Zeitstempeltyp": 0}
{"Schlüssel": "ja", "Wert": "nein", "Thema": "Test", "Partition": 0, "Offset": 5, "Zeitstempel": "2008-01-24 18:01:01.003", "Zeitstempeltyp": 0}
''';

-- Daten als Tabelle laden
lade jsonStr.`data` als Datenquelle;

--convert Tabelle als Streamquelle
Optionen für mockStream.`datasource` laden 
Schrittgrößenbereich="0-3"
als newkafkatable1;

-- Aggregation 
Wählen Sie Cast (Wert als Zeichenfolge) als k aus newkafkatable1
als Tabelle21;


!callback-Post „http://127.0.0.1:9002/api_v1/test“, wenn „gestartet, Fortschritt, beendet“;
-- geben Sie das Ergebnis auf der Konsole aus.


speichern anhängen table21 
als Benutzerdefiniert.`` 
Optionenmodus="Anhängen"
und Dauer="15"
und sourceTable="jack"
und Code='''
wähle count(*) als c von Jack als Newjack;
Speichern Sie „Newjack“ als Parquet anhängen. `/tmp/jack`; 
'''
und checkpointLocation="/tmp/cpl15";

Zusammenfassen

Das Obige ist der vollständige Inhalt dieses Artikels. Ich hoffe, dass der Inhalt dieses Artikels einen gewissen Lernwert für Ihr Studium oder Ihre Arbeit hat. Vielen Dank für Ihre Unterstützung von 123WORDPRESS.COM.

Das könnte Sie auch interessieren:

Der Mysql LONGBLOB-Typ speichert Binärdaten (Änderung + Debuggen + Sortieren)
Der Mysql LONGTEXT-Typ speichert große Dateien (binär ist auch möglich) (Änderung + Debuggen + Sortieren)
Mysql-Einfügen von Chinesisch und chinesische Abfrage (Änderung + Debuggen)
Konfiguration einer PHP-Debugging-Umgebung für Anfänger (IIS+PHP+MYSQL)
Verwandte Methoden des MySQL UDF-Debugmodus debugview
Teilen Sie 101 MySQL-Debugging- und Optimierungstipps
GDB-Debugging, MySQL-Kompilierung und Installation des tatsächlichen Kampfquellcodes

<<: Abrufen der Erstellungszeit einer Datei unter Linux und ein praktisches Tutorial

>>: Verwendung der JavaScript-Sleep-Funktion

JavaScript, um einen Lotterieeffekt zu erzielen

Artikel empfehlen

Details zur MySQL-Datenbankarchitektur

Inhaltsverzeichnis 1. MySQL-Architektur 2. Netzwe...

Detaillierte Erläuterung der Javascript-Ereigniserfassungs- und Bubbling-Methoden

Inhaltsverzeichnis 1. Ereignisverarbeitungsmodell...

Detaillierte Erläuterung des Problems, dass die Synchronisierung des Warehouse-Cache nach dem Ändern der Yum-Quelle in CentOS8 fehlschlägt

Ursache des Problems: Zunächst kann die Standard-...

Wie MLSQL Stack das Stream-Debugging vereinfacht

JavaScript, um einen Lotterieeffekt zu erzielen

Detaillierte Erläuterung zur Entwicklung von JavaScript-Webseiten auf Einstiegsniveau

Der Unterschied und die Verwendung von Strg+z, Strg+c und Strg+d in Linux-Befehlen

Beispielcode für nahtloses Scrollen mit Flex-Layout

So verwenden Sie Docker zum Erstellen eines Tomcat-Clusters mit Nginx (mit Bildern und Text)

Grundlagen der HTML-Bearbeitung (ein Muss für Anfänger)

Wie gestaltet man eine Webseite? Wie erstelle ich eine Webseite?

Referenz zur Webseitenerstellung im IE6 - Standardstil im IE6

Tutorial zum Bereitstellen mehrerer Server mit WebAPI und Konfigurieren des Nginx-Lastausgleichs

Implementierungscode für unendliches Scrollen mit n Containerelementen

Artikel empfehlen

Details zur MySQL-Datenbankarchitektur

Detaillierte Erläuterung der Javascript-Ereigniserfassungs- und Bubbling-Methoden

Detaillierte Erläuterung des Problems, dass die Synchronisierung des Warehouse-Cache nach dem Ändern der Yum-Quelle in CentOS8 fehlschlägt

Führen Sie die Schritte zum Konfigurieren einer statischen IP-Adresse für eine virtuelle Linux-Maschine aus

Grafisches Tutorial zu MySQL-Downloads und Installationsdetails

Die Hook-Funktion von Vue-Router implementiert Routing Guard

Analyse des Ausschnitts des Hintergrundbildes des Neunerrasters mit adaptiver Breite und Höhe

Führen Sie die Schritte für die Trennung von Nginx-Proxy-Frontend und Backend mit demselben Domänennamen aus.

Vue Routing gibt die Betriebsmethode zum Wiederherstellen des Seitenstatus zurück

Tutorial zur binären Kompilierung und Installation von MySql centos7 unter Linux

Vorschau auf die neuen Funktionen von XHTML 2.0

Detaillierte Erklärung des Docker-Befehls zum Sichern des Linux-Systems

CSS3-Mobil-Vw+Rem-Methode zum Erreichen eines reaktionsfähigen Layouts ohne Abhängigkeit von JS

Detaillierte Erklärung zu MySQL-Phantomlesevorgängen und wie man sie eliminiert

Tutorial zum Installieren und Ändern des Root-Passworts der dekomprimierten Version von MySQL 5.7.20