Wären Bruce-Willis-Filme in Deutschland jemals so erfolgreich geworden, ohne das ikonische "Yippie-Ya-Yay, Schweinebacke" seines Synchronsprechers Manfred Lehmann? Hätte es schon in den Achtzigerjahren Übersetzungssoftware von heute gegeben, würde der Spruch im Film Stirb Langsam vielleicht anders lauten. Jedenfalls übersetzt ein Tool des Unternehmens HeyGen, das Videos mit künstlicher Intelligenz in andere Sprachen überträgt, das Wort "motherfucker" aus dem englischen Original mit einem Schimpfwort ins Deutsche. Und zwar mit einem, das näher an der tatsächlichen Wortbedeutung bleibt, aber deutlich weniger familientauglich ist – und vermutlich auch weniger Kultpotenzial bietet. Dafür aber spricht Bruce Willis in den generierten Videos plötzlich Deutsch, mit seiner eigenen Stimme.   

Solche Experimente mit der Software von HeyGen sind gerade in sozialen Medien sehr populär. Das Start-up aus Kalifornien hat vor wenigen Tagen ein Tool in der Beta-Version frei verfügbar gemacht, das Videos von sprechenden Personen in eine von acht Sprachen überträgt und dabei auch die Bewegung der Lippen anpasst. Ein User generierte mithilfe des KI-Werkzeugs ein Video von Fußballstar Lionel Messi, in dem der auf einer Pressekonferenz Englisch spricht – überraschend, weil Messi sich sonst eher davor scheut, sich in der Öffentlichkeit auf Englisch zu äußern. Joshua Xu, CEO und Co-Gründer von HeyGen, postete bei X (früher Twitter) Videosequenzen, in denen Elon Musk ins Französische übersetzt spricht und die US-Influencerin Emma Chamberlain ins Italienische.

Dieses Deep Learning Dubbing genannte Verfahren ist erst mal nicht völlig neu. In der Filmindustrie werden bereits ähnliche KI-Tools verwendet. Neu ist aber, wie einfach zugänglich die Synchronisation nun ist. Wie auch bei anderen neuen KI-Anwendungen zeigt HeyGen vielen Menschen plötzlich und eindrucksvoll, was möglich ist. Und was möglicherweise droht. Hat Deep-Dubbing-KI das Potenzial, Übersetzer und Synchronsprecher abzulösen?

Mit Abo vorbei an der Warteschlange

ZEIT ONLINE hat die Anwendungen getestet, um einen ersten Eindruck davon zu bekommen, wie gut die Qualität der generierten Übersetzungen tatsächlich ist.  

Stimmimitation und synchronisierte Lippenbewegung: Die KI des Unternehmens HeyGen übersetzt Videos in acht Sprachen.

Dafür ist im Grunde nur ein Account bei HeyGen nötig, der Videoupload läuft im Browser. Zwei Videos kann man im Tool von HeyGen kostenlos übersetzen lassen, allerdings gibt es dafür derzeit eine mindestens tagelange Warteschlange. Gegen eine Gebühr (ab 29 Euro pro Monat) kann man diese überspringen und mehr Videos übersetzen lassen. Ein solches Abo hat ZEIT ONLINE für den Test abgeschlossen.  

Nach dem Upload wurde unser 35-sekündiges Video in weniger als sechs Minuten bearbeitet und in sieben Sprachen übersetzt und synchronisiert. Die Dateigröße des Videos wurde dabei von HeyGen in etwa auf ein Fünftel geschrumpft. Die Software kann mit Videos zwischen 30 Sekunden und fünf Minuten Länge umgehen.

Zum Start unterstützt sie als Eingabe die Sprachen Englisch, Spanisch, Französisch, Chinesisch, Deutsch, Italienisch, Portugiesisch, Niederländisch, Hindi und Japanisch. Übersetzt werden kann nur ins Englische, Spanische, Französische, Hindi, Italienische, Deutsche, Polnische und Portugiesische. Es sollen bald noch weitere Sprachen verfügbar sein.