Während der Corona-Pandemie sind Online-Formate wie Schulungen, Meetups, Konferenzen, etc. populär geworden. Durch die Aufzeichnung der Sessions ist der Zugang zu den Inhalten jederzeit möglich. Digitale Inhalte zum Selbststudium sind heute schon Standard. Doch so manche Session ist nach einiger Zeit nicht mehr aktuell und müsste neu aufgenommen werden. Denken wir nur an Schulungsunterlagen, die immer wieder aktualisiert und angepaßt werden müssen. Hier kommt die Vertonung von Texten ins Spiel. Mit Text-to-Speech-Services von Anbietern wie Amazon, Google, IBM, etc. kann das heutzutage schnell erledigt werden. Doch gerade bei technischen Texten mit vielen Abkürzungen, Akronymen und Anglizismen sind diese Services schnell an ihren Grenzen angelangt. Stell dir doch mal vor, was ein einfacher Text-to-Speech-Service aus dem Wort “.Net” macht.

In dieser Session stellen wir live vor, wie man aus einem Skript und den dazugehörigen Folien einer Präsentation ein vertontes Video erstellt. Insbesondere wird auf die Verwendung von sog. Custom Models eingegangen, die für eine richtige Betonung von ungewöhnlichen Wörtern eingesetzt werden.