Sprachsimulation per Software -

Autor: Martin Hopfengart

In Zeiten von Fake-News stellt sich die Frage nach der Glaubwürdigkeit des gesprochenen Wortes: Künstliche Intelligenz erzeugt Sprache, die so nie stattgefunden hat. Wissenschaftler und Sprachkünstler erörtern den Zusammenhang zwischen Sprache und Persönlichkeit.

„Die Grenzen meiner Sprache bedeuten die Grenzen meiner Welt„
(Ludwig Wittgenstein, 1922)

Es klingt nach Science Fiction, stammt aber bereits aus dem Jahr 2016: Der Software-Hersteller Adobe stellt seine Software ‚Project VoCo‘ vor. Diese analysiert aus Sprachaufnahmen die wesentlichen Merkmale einer menschlichen Stimme. Daraus werden Algorithmen generiert,
die schriftliche Texte dann als Sprache mit den Charakteristika der vorgegebenen Stimme ausgeben – und das in beachtlicher technischer Qualität. Mittlerweile haben weitere Hersteller wie etwa Descript mit ‚Lyrebird AI‘ nachgezogen und stellen damit die Glaubwürdigkeit von Sprachaufnahmen in Frage.

Intelligente Kunst durch Künstliche Intelligenz?
Claudia Urbschat-Mingues ist professionelle Sprecherin. Täglich um 20 Uhr hört man ihre Stimme in der ARD: „Hier ist das erste deutsche Fernsehen mit der Tagesschau“. Darüber hinaus ist sie auch die deutsche Synchronstimme von Angelina Jolie und sieht der neuen Technologie gelassen entgegen, denn „bis sie die Emotionen so akkurat auf den Punkt imitieren können, bin ich schon lange keine Synchron-Schauspielerin mehr.“ Sie vertraut weiterhin auf erfahrbare Authentizität, denn für das sogenannte ‚Photoshop der Sprache‘ sieht sie „jetzt noch nicht die Akzeptanz beim gesamten Publikum.“ Ergo: „Gute Synchronschauspieler wird das nicht ersetzen können.“
Manfred Lehmann ist die deutsche Stimme von Bruce Willis. Der Schauspieler und Synchronsprecher sieht es ähnlich: „Klar kann man Stimmen imitieren, aber das muss sich doch sehr ‚kalt‘ anhören.“

Lehmann, der seit fast 50 Jahren als Sprecher arbeitet und auch Gérard Depardieu sowie Kurt Russell synchronisiert, fügt hinzu: „Bei Synchron oder bei künstlerischen Sachen kann ich mir das nicht vorstellen.“

Es gibt kein richtiges Leben im falschen
Sprache ist zugleich Kommunikation und Imagination. Der Sprachwissenschaftler Walter Sendlmeier definiert den Zusammenhang: „Die Stimme gibt einen tiefen Einblick in die Persönlichkeit. Bestimmte akustische Merkmale im Stimmklang und bei der Sprechweise machen deutlich, ob jemand extrovertiert oder introvertiert, emotional eher stabil oder labil ist, ob sich jemand unter Kontrolle hat oder aggressiv, gewissenhaft oder nachlässig ist.“
Kritiker der Simulations-Software bemängelten das enorme Potenzial zur Manipulation sowie Bedenken in puncto Ethik und Sicherheit. Auch Johannes Steck, einer der bekanntesten deutschen Hörbuch-Sprecher, ist kritisch: „Die Wahrhaftigkeit wird immer schwieriger nachzuvollziehen sein. Wir schaffen uns damit letztendlich selbst ab.“ Er sieht bei Software wie ‚Lyrebird AI‘ eine historische Zäsur „wie bei der industriellen Revolution vor 200 Jahren“ und ergänzt: “Das Menschliche fehlt: unsere Einzigartigkeit.“

Adobe hat sein Projekt vorerst auf Eis gelegt, aber andere Tech-Konzerne führen das Experiment weiter. Wie sehr Stimmen glaubhafte Charaktere prägen, bleibt also bis auf weiteres noch der Spezies Mensch vorbehalten. Die Künstliche Intelligenz schreitet auf diesem Gebiet weiter voran, scheint aber noch nicht am Ziel zu sein. Bis dahin gelten die Worte Ludwig Wittgensteins:
„Worüber man nicht sprechen kann, darüber muss man schweigen.“

Schreibe einen Kommentar Antworten abbrechen