Das Thema Datenmigration stellt für viele Banken und Versicherungen eine zentrale Herausforderung dar, die zumeist manuell von Data Engineers durchgeführt wird und das Ziel hat, unterschiedlich persistierte, aber semantisch identische Informationen aus unterschiedlichen Quellsystemen zu vereinheitlichen, um z.B. neue Informationen zusammenzustellen oder abzuleiten. Dabei bringt diese Aufgabe durch ihre repetitive und manuelle Ausführung Raum für Fehler und Ungenauigkeiten mit sich.

Genau an dieser Stelle kann der Einsatz leistungsfähiger LLMs durch eine (Teil-)Automatisierung des Migrationsprozesses zu einer signifikanten Effizienz- und Qualitätssteigerung führen.
Diese Steigerung wird dabei dadurch erreicht, dass dem LLM zunächst Informationen über die Daten innerhalb der Quellsysteme bereitgestellt werden. Diese Informationen beinhalten u.a. sowohl Beschreibungen der Daten als auch Meta-Informationen über die Daten. In der Folge ist das LLM in der Lage, dem Data Engineer Vorschläge über mögliche Abbildungen, sog. Mappings, der Daten bereitzustellen, die dieser dann bewerten und ausführen kann. Die Vorschläge werden dem Data Engineer dabei über eine grafische Benutzeroberfläche angezeigt.

Im Rahmen des Vortrags wird den Teilnehmern mittels einer Demo und drei konkreten Praxisbeispielen das Potenzial des Ansatzes verdeutlicht. Des Weiteren wird auf die verwendeten Technologien wie LangChain, PromptFlow und Label Studio für die Umsetzung eingegangen.