Process Engines mit Unterstützung von BPMN (Business Process Model and Notation), wie z. B. Camunda, erfreuen sich immer größerer Beliebtheit. Durch die systemgestützte Ausführung von Unternehmensprozessen fällt eine Menge Prozessdaten an, deren Nutzung ein großes Potenzial für die Optimierung der Prozesse bietet.

In diesem Talk zeigen wir, wie wir mit Hilfe von Apache Spark eine leistungsfähige Pipeline zur Vorverarbeitung von Prozessdaten realisiert haben, um damit Machine-Learning-Algorithmen in H2O anlernen zu können. Diese können in verschiedenen Stufen zur Unterstützung und Optimierung von Unternehmensprozessen eingesetzt werden. Zudem zeigen wir am Beispiel von Camunda, wie wir mit Hilfe von Apache Kafka die Prozessdaten so extrahieren und archivieren, dass der Produktivbetrieb der Process Engine nicht beeinträchtig wird, wir aber trotzdem einen schnellen und effizienten Zugriff auf die Prozessdaten haben. Wie wir dies in der Praxis bereits bei unseren Kunden Duni und Provinzial erprobt haben, darüber wird ebenfalls in diesem Talk berichtet. Wir freuen uns über Feedback und Beiträge zum zugehörigen Open-Source-Prozess bpmn.ai.