Was sind die neuen Funktionen von Apache Spark 2.4, das 2018 veröffentlicht wird?

Was sind die neuen Funktionen von Apache Spark 2.4, das 2018 veröffentlicht wird?

Dieser Artikel stammt vom Apache Spark Meetup, das am 19. September 2018 bei Adobe Systems Inc. stattfand.

Die kommende Version von Apache Spark 2.4 ist die fünfte in der 2.x-Reihe. Dieser Artikel bietet einen Überblick über die wichtigsten Funktionen und Verbesserungen in Apache Spark 2.4.

  • Das neue Planungsmodell (Barrier Scheduling) ermöglicht es Benutzern, verteiltes Deep-Learning-Training ordnungsgemäß in Spark-Phasen einzubetten, um den verteilten Trainings-Workflow zu vereinfachen.
  • 35 höherwertige Funktionen für Array-/Map-Operationen in Spark SQL hinzugefügt.
  • Eine neue native AVRO-Datenquelle basierend auf dem Spark-Avro-Modul von Databricks wurde hinzugefügt.
  • PySpark führt außerdem einen Eager-Evaluation-Modus für alle Vorgänge zum Lehren und Debuggen ein.
  • Spark auf K8S unterstützt PySpark und R und unterstützt den Client-Modus.
  • Verschiedene Verbesserungen für strukturiertes Streaming. Beispielsweise zustandsbehaftete Operatoren bei kontinuierlicher Verarbeitung.
  • Verschiedene Leistungsverbesserungen an integrierten Datenquellen. Beispielsweise das Beschneiden verschachtelter Schemata in Parquet.
  • Unterstützung für Scala 2.12.

Klicken Sie auf Shishuo.com, um diese PPT herunterzuladen.

Zusammenfassen

Oben habe ich Ihnen die neuen Funktionen von Apache Spark 2.4 vorgestellt, das 2018 auf den Markt kommt. Ich hoffe, es wird Ihnen helfen. Wenn Sie Fragen haben, hinterlassen Sie mir bitte eine Nachricht und ich werde Ihnen rechtzeitig antworten. Ich möchte auch allen für ihre Unterstützung der Website 123WORDPRESS.COM danken!

Das könnte Sie auch interessieren:
  • So verwenden Sie Spark und Scala zum Analysieren von Apache-Zugriffsprotokollen
  • Apache Spark 2.0-Jobs brauchen lange, bis sie abgeschlossen sind

<<:  Hinweise zur Verwendung von $refs in Vue-Instanzen

>>:  So ändern Sie das MySQL-Passwort unter Centos

Artikel empfehlen

VMware Workstation ist nicht mit Device/Credential Guard kompatibel

Beim Installieren einer virtuellen Maschine wird ...

MySQL-Tutorial: Datendefinitionssprache (DDL), Beispiel, ausführliche Erklärung

Inhaltsverzeichnis 1. Einführung in die Grundfunk...

Zusammenfassung häufig verwendeter MySQL-Befehle im Linux-Betriebssystem

Hier sind einige gängige MySQL-Befehle für Sie: -...

Implementierung eines einfachen Whack-a-Mole-Spiels in JavaScript

In diesem Artikel finden Sie den spezifischen Cod...

Eine kurze Diskussion darüber, ob zu viele MySQL-Datenabfragen OOM verursachen

Inhaltsverzeichnis Auswirkungen eines vollständig...

Einführung in Netzwerktreiber für Linux-Geräte

Kabelgebundenes Netzwerk: Ethernet Drahtloses Net...

VMware Workstation Pro installiert das Win10-Betriebssystem in Reinform

Dieser Artikel beschreibt die Schritte zur Instal...

Erste Zusammenfassung des Website-Erstellungs-Tutorials für Anfänger

Nachdem ich diese sechs Artikel geschrieben hatte,...

Einige Vorschläge zur Verbesserung der Nginx-Leistung

Wenn Ihre Webanwendung nur auf einer Maschine läu...

HTML-Tabellen-Tag-Tutorial (46): Tabellenfußzeilen-Tag

Mit dem Tag <tfoot> wird der Stil der Tabel...

Multiservice-Image-Packaging-Vorgang von Dockerfile unter Aufsicht

Schreiben einer Docker-Datei Konfigurieren Sie di...

Erfahren Sie, wie Sie den JVM-Speicher von Tomcat über JConsoler überwachen

Inhaltsverzeichnis 1. So überwachen Sie Tomcat 2....