Die Kosten für Speichermedien sinken und das systematische Sammeln von Datenmassen aller Arten wird immer leichter. Big Data ist in den Unternehmen angekommen. Viele Projekte sind bereits über den Pilot- oder Prototypenstatus hinaus. Apache Spark ist ein skalierbares System für die flexible Verarbeitung großer Datenmengen.

Der Vortrag stellt Apache Spark 2 vor, beschreibt Einsatzszenarien und zeigt konkrete Beispiele mit Java 8 aus dem Bereich des maschinellen Lernens.