Retrieval-Augmented Generation (RAG) hat sich zu einer zentralen Methode für den produktiven Einsatz generativer KI in Unternehmen entwickelt. Doch mit ständig neuen Anforderungen – etwa durch fortgeschrittene Retrieval-Techniken, agentenbasierte Workflows oder multimodale Eingaben – stoßen viele bestehende Lösungen an ihre Grenzen: technische Schulden und mangelnde Skalierbarkeit sind häufig die Folge. 

Dieser Vortrag zeigt, wie sich zukunftssichere RAG-Systeme mithilfe erprobter Architekturkonzepte und Open-Source-Tools wie LiteLLM oder Langfuse aufbauen lassen. Anhand konkreter Use Cases aus verschiedenen Branchen werden erprobte Konzepte und Implementierungsstrategien vorgestellt. Besonderer Fokus liegt auf der schnellen Integration neuer Technologien (z.  B. agentischer Workflows) sowie der domänenübergreifenden Skalierung typischer GenAI-Anwendungen wie Wissensmanagement oder Kundenservice. 

Der Vortrag liefert praxisnahe Einblicke und konkrete Handlungsempfehlungen für Fachleute, die RAG-Prototypen in skalierbare, produktionsreife Systeme überführen möchten.