In der Entwicklung von autonomen Systemen wie z .B. Robotern fallen Terabyte von Sensordaten an. Dabei müssen trainierte Modelle Vorhersagen treffen bzw. Routen berechnen und sich in einer komplexen Umgebung zurechtfinden. Da bessere Modelle durch mehr Trainingsdaten und mehr Rechenleistung erreicht werden, muss eine verteilte Architektur horizontal skalieren und bevorzugt mit GPUs ausgestattet sein. Jan wird in diesem Vortrag im Detail vorstellen, was sein Team und er beim Aufbau einer Distributed Machine-/Deep Learning-Plattform gelernt haben und welche Herausforderungen sie dabei zu lösen hatten.