Heiko Spindler

14.12.2017

10:00 - 10:45

Raum Stratus 2

Session

  IT-Tage 2021
  •  Live-Streaming von über 200 Vorträgen in 18 Subkonferenzen.
  •  365 Tage On-Demand-Zugriff auf 260 Vortragsvideos und ein umfangreiches Archiv an Informationen der Konferenz.
  •  Weitere 7 Remote-Konferenzen in 2022.

Die Kosten für Speichermedien sinken und das systematische Sammeln von Datenmassen aller Arten wird immer leichter. Big Data ist in den Unternehmen angekommen. Viele Projekte sind bereits über den Pilot- oder Prototypenstatus hinaus. Apache Spark ist ein skalierbares System für die flexible Verarbeitung großer Datenmengen.

Der Vortrag stellt Apache Spark 2 vor, beschreibt Einsatzszenarien und zeigt konkrete Beispiele mit Java 8 aus dem Bereich des maschinellen Lernens.