Anzeige

Aravoices

Springer startet eigene Text-to-Speech-Anwendung

Samir Fadlallah, COO und CTO Axel Springer News Media National – Foto: Axel Springer

Audio ist im Trend und geht weit über den immer noch grassierenden Podcast-Hype hinaus. Ein ganz eigenes Audio-Spielfeld sind Markenstimmen. Bei Axel Springer hat man mit Aravoices nun eine eigene Text-to-Speech-Anwendung entwickelt, die künftig auch Medien außerhalb des eigenen Hauses angeboten werden soll.

Anzeige

Aravoices ermöglicht das Erstellen einer individuellen, synthetischen Markenstimme, die für vielerlei Zwecke eingesetzt werden kann. Der offensichtlichste Nutzungsfall ist das Vorlesen von Artikeln. Wie das klingt, kann man bei Springers „Welt“ bereits online hören, zum Beispiel hier.

Die Stimme soll sukzessive auf weitere Formate und Kanäle, wie beispielsweise Smart-Speaker, ausgeweitet werden und zukünftig „die zentrale und wiedererkennbare Markenstimme von ‚Welt“ bilden“, wie es bei Springer heißt. Ein bisschen weniger scheppern und ein bisschen mehr betonen lernt die Stimme der „Welt“ dann hoffentlich noch. Die Markenstimmen lassen sich laut Anne Küpper, Product Owner von Aravoices bei Axel Springer individuell anpassen: „Wir wollen mit Aravoices synthetischen Stimmen produzieren, die so einzigartig sind, wie die Marken, die sie verwenden.“

Bei Springer schielen sie mit Aravoices zudem auf den boomenden Markt mit Smartspeakern. Wobei das Gros der schlauen Lautsprecher derzeit noch fest mit Software von US-Plattformkonzernen wie Amazon (Alexa), Google (Assistant) und Apple (Siri) verbandelt ist. Hier einen Fuß in die Tür zu bekommen, ist nicht ganz einfach. Wie Samir Fadlallah, COO und CTO Axel Springer News Media National, sagt, soll Aravoices hier die Abhängigkeit von den Plattformen ein Stück weit reduzieren helfen. Er hat uns ein paar Fragen zu der neuen Anwendung beantwortet:

Warum setzt Springer mit Aravoices auf eine Eigenentwicklung bei Text-to-Speech-Systemen?

Die derzeit im Markt genutzten Stimmen sind generisch und werden oft von vielen Kunden gleichzeitig verwendet. Das macht sie austauschbar. Mit Aravoices haben wir die Möglichkeit, synthetische Stimmen zu entwickeln, die auf die Besonderheiten einzelner Marken zugeschnitten sind. Da Text-To-Speech-Services derzeit überwiegend von den großen Tech-Plattformen angeboten werden, ist Aravoices ein weiterer Schritt, um die Abhängigkeit von deren Services zu reduzieren.  

Wird Aravoices künftig als eigenständiges Geschäftsmodell gesehen?

Im ersten Schritt wollen wir Aravoices bei weiteren Axel-Springer-Marken an den Start bringen. Danach wollen wir unsere Services perspektivisch auch externen Marken anbieten. Ob daraus letztlich ein eigenes Geschäftsmodell entsteht, wird sich zeigen.

Können Sie Erkenntnisse teilen, wie stark und für welchen Zweck derzeit schon Text-to-Speech Angebote bei der „Welt“ genutzt werden?

Derzeit werden pro Tag etwa 20 Artikel auf Welt.de mit der Markenstimme vertont. Das Angebot wird gut angenommen, die durchschnittliche Durchhörrate liegt weit über 30 Prozent.

Welche konkreten Anwendungsfälle über das Vorlesen von Artikeln hinaus sind noch denkbar?

Mit der Erstellung einer synthetischen Markenstimme schaffen wir das Fundament für verschiedenste Audioformate. Neben der Vorlesefunktion auf der eigenen Webseite können das im nächsten Schritt z.B. Voice Apps für Sprachassistenten sein. Nicht ohne Grund stellt die Frage nach den aktuellen Nachrichten bei Sprachassistenten einen der am häufigsten genutzten Services dar.

Anzeige