Datengetriebene Anwendungen mit maschinellen Lernmodellen platzieren sich zunehmend in der Produktlandschaft. Viele Projekte passen ihre Entwicklungsstrategien und -muster jedoch nicht auf die Besonderheiten dieser Technologien an.
Wir erklären, wie Data Scientisten und Engineers Tools wie DVC nutzen können, um sämtliche Elemente eines Projekts zu versionieren: Angefangen beim Datensatz, über den Code bis zum Modell selbst. Das ist aber noch nicht alles! Unser Code deckt den ganzen Entwicklungsprozess ab, einschließlich Experimente und Reproduzierbarkeit, sowie Release und Deployment des Modells in die freie Wildbahn.