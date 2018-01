Audio-Formate und Sprachassistenten befinden auf dem Vormarsch und werden auch 2018 eines der Trendthemen in der Medienbranche sein. Neben dem Smartphone machen so genannte Smart Speaker wie Amazons Echo oder Google Home das Feld der Audio-Inhalte für Redaktionen und Content-Produzenten interessanter. MEEDIA zeigt, welche Werkzeuge notwendig sind, um sich als Medienanbieter durchzusetzen.

In der Redaktion von T-Online in Berlin hat man unter Umständen nicht einmal auf dem stillen Örtchen seine Ruhe. Ein kurzer Sprachbefehl reicht aus und schon erklingt eine Stimme, die das Wetter für die Mittagspause vorträgt, die aktuelle Nachrichtenlage vorliest oder die eigene Lieblingsmusik auflegt. In den Redaktionsräumen in der Torstraße kann man der letzte Mitarbeiter im Büro sein und Selbstgespräche führen, eine hört immer mit: Alexa, die smarte Sprach-Assistentin von Amazon. Selbst in den Toiletten der Redaktion warten ihre Mikrofone darauf, die Wünsche der Belauschten zu erfüllen. Im Zweifel ließe sich mit ihr sogar Klopapier nachbestellen.

Die überall in der Redaktion verbauten Mikrofone sind Teil eines Raumkonzeptes, mit dem T-Online den „modernsten Newsroom“ in Deutschland betreiben will. Ob Amazons Alexa, Google Home oder der bald in Deutschland verfügbare Home Pod von Apple: Sprachassistenten und deren Steuerung zählen auch in diesem Jahr zu den großen Trendthemen, auf die sich Medien einstellen, um ihren Konsumenten noch ein Stückchen näher kommen.

„In zehn Jahren wird man mit Wehmut und Belustigung auf die Phase schauen, als in der digitalen Sphäre schriftliche Interaktion der Standard war“, hielt erst vor einigen Tage Spiegel-Online-Kolumnist und Digital-Philosoph Sascha Lob fest. Smart Speaker sind „Einstiegsdroge“ und zugleich „Brückentechnologie“, die das gesellschaftliche Leben verändern könnten, wie es zuletzt das iPhone getan hat. Kurz: Smart Speaker sind der neue heiße Scheiß.

Bisherige Zahlen bestätigen das. Verlässliche Angaben gibt es zwar nicht, Schätzungen zufolge verkauft aber allein Google seit Oktober vergangenen Jahres sekündlich mindestens einen Google-Home-Speaker, Amazon setzte allein im Weihnachtsgeschäft mindestens 20 Millionen Geräte mit Sprachassistenten-Funktion ab. Mit der Sprachsteuerung und entsprechenden Audio-Formaten sind durchaus Visionen verbunden. Ausgehend von wachsenden Datenvolumina auf mobilen Endgeräten, wird nicht nur Video- sondern auch Audiostreaming voraussichtlich zunehmen, Sprachassistenten werden nicht nur in der heimischen Küche beim Morgenkaffee die Nachrichten vorlesen, sondern auch während der Autofahrt zur Arbeit Befehle ausführen und für Unterhaltung sorgen.

Geräte wie Amazons Echo-Modelle verfolgen in erster Linie natürlich eigene kommerzielle Ziele. Ein unbedachter Befehl reicht aus und in den Regalen des nächsten Logistiklagers wird bereits nach der neuen Waschmaschine gesucht, die Alexa eben bestellt hat. Um im Alltag des Nutzers eine hohe Akzeptanz zu erlangen, müssen die Geräte aber sehr viel mehr leisten als ein verlängerter Arm des E-Commerce zu sein. Deshalb konzipieren Hersteller ihre Smart Speaker als Plattformen, auf denen sich künftig viele Akteure aus Handel und Medien zusammenfinden und um die Aufmerksamkeit des Nutzers kämpfen werden.

Für Medien bedeutet das, dass es eine weitere Plattform gibt, für die sie Inhalte aufbereiten können. Etabliert hat sich dafür der Begriff der „Homeless Media“. Losgelöst von der eigenen Homepage spielen Medienanbieter ihre Inhalte mittlerweile auf Plattformen wie Facebook Instant Articles oder Googles AMP aus, Fernsehsender machen ihre Mediatheken nicht mehr nur im Web verfügbar, sondern auch mit Hilfe von TV-Erweiterungen wie Google Chrome oder Amazon Fire TV, für Podcasts haben sich Plattformen wie iTunes, Soundcloud oder Spotify etabliert. Mit Audible ist derzeit ebenfalls wieder Amazon dabei, eine weitere Plattform zu schaffen. Die ARD hat gar eine eigene App entwickelt, die all ihre Audioformate bündelt. Und die Hör-Inhalte werden mehr angenommen denn je. Erstmals seit Jahren liegt die Nutzung laut ARD-/ZDF-Onlinestudie wieder fast gleichauf mit Video. Denn Audio ist jederzeit und überall verfügbar: beim Kochen, Joggen, im Auto. 13 Prozent der Nutzung entfallen auf Podcasts.

“Audio ist der Text der mobilen Generation“

Mit Smart Speakern kommen neue Endgeräte hinzu, die wieder eigene Anforderungen mitbringen. Sie locken Inhalte-Produzenten an, für die Audio-Inhalte bislang kaum beziehungsweise gar keine Rolle gespielt haben. „Das Radio hat sein Monopol verloren. Das Internet hat die Art und Weise verändert, wie wir Audio-Inhalte konsumieren“, sagt Marc Krüger. Er ist gelernter Radiojournalist und bislang einer der wenigen, die innerhalb der Branche zu einem Publisher gewechselt sind, um dort voranzutreiben, was er am besten kann: Als „Voice Redakteur“ soll er bei T-Online nicht nur über Sprachsteuerung schreiben, sondern Audio-Formate entwickeln und Inhalte produzieren. Im Team von Chefredakteur Florian Harms sind Audio-Inhalte ein neuer, aber wichtiger Bestandteil der Strategie zur publizistischen Aufwertung des Portals. Aktuell arbeite die Redaktion daran, erste „Leuchttürme“, wie Harms es nennt, zu bauen. Mit der audiovisuellen Aufbereitung des „Tagesanbruch“-Newsletters wolle man probieren und zeigen, was geht.

Dass Audio-Inhalte in Zukunft eine dominierende Rolle in der Medienlandschaft einnehmen, glaubt nicht nur Sascha Lobo. “Audio ist der Text der mobilen Generation“, sagt Michael Bröcker. Seine Rheinische Post hat als eines der ersten regionalen Medienhäuser den Audiotrend erkannt Mitte 2017 richtig losgelegt.. Begonnen haben die Audio-Aktivitäten sogar ein Jahr früher, als die Redaktion begann, WhatsApp-Nachrichten nicht nur zu texten, sondern auch als Sprachnachrichten an die Nutzer zu verschicken. „Reden ist das neue Schreiben und Hören das neue Lesen“, lautet seine These. Auch deshalb gehe es darum, Inhalte für neue Audio-Plattformen möglichst schnell zu professionalisieren. Die Rheinische Post bietet mittlerweile sechs unterschiedliche Podcast-Formate an, mit denen sie eigenen Angaben zufolge mehr als 300.000 Zugriffe pro Monat verzeichnet. Den morgendlichen „Aufwacher“-Podcast vertreiben sie auch via Amazon Echo.

Mit den neuen Playern wächst die Konkurrenz im ohnehin schon großen Wettbewerbsfeld. Radio- wie auch TV-Sender bringen bereits professionell produzierte audiovisuelle Inhalte mit, ohne zusätzlichen Aufwand zu betreiben. Vor allem im Umfeld der Kurznachrichten heben sich Marken wie „Tagesschau“ oder n-tv mit ihren prägnanten Senderstimmen auf der Alexa-Plattform vom Umfeld ab, das größtenteils auf die noch blecherne Alexa-Stimme setzt, ab.

Auch wenn die RP in ihrem Echo-Skill (Skills sind so etwas wie programmierte Audio-„Apps“ für die Alexa-Plattform) News noch vom Computer vorlesen lässt, ist für Bröcker klar: “Kein Mensch braucht die vorgelesene Zeitung; das plumpe Vertonen von Nachrichten kann und wird nicht ausreichen.“ Der Hörer habe den Anspruch, informativ unterhalten zu werden, weshalb das Interesse an Podcasts sehr viel größer sei. Deshalb, glaubt Bröcker, ist der Markt trotz der Vielzahl an klassischen Anbietern noch nicht gesättigt. „Zeitungen haben sich über viele Jahre als Marken etabliert und treue Leser und Nutzer aufgebaut. Diese hören vielleicht klassisches Radio. Sie würden sich aber gerne auch Neuigkeiten von ihrer Lieblingszeitung anhören.”

Sprachassistenten eröffnen freilich nicht nur für Nachrichtenmedien neue Möglichkeiten. Medienanbieter zielen darauf ab, zukünftig Ansprechpartner für zahlreiche Interaktionen zu werden. Während sich beispielsweise Programmies noch darauf beschränken, Alexa und Co. das TV-Programm aufsagen zu lassen, könnten Anbieter wie TV Spielfilm zukünftig auch für die Interaktion mit dem Endgerät verantwortlich sein. Erweiterungen wie Echo-Show, ein Alexa-Lautsprecher mit Bildschirm, geben den Inhalte-Produzenten die Möglichkeit, auch Video-Material zu zeigen.

Um sich im Kampf um die Aufmerksamkeit aus der Masse hervorzuheben, ist das Herausarbeiten der eigenen Marke von großer Bedeutung. “Der Sprachsteuerung eine individuelle und unverkennbare Stimme zu geben, zählt derzeit zu den Hauptaufgaben – womöglich ist es sogar die wichtigste“, sagt T-Online-Mann Krüger. Während in Podcasts die Aufgabe von Moderatoren und Redakteuren übernommen werden kann, überlegt seine Redaktion – wie auch die Rheinische Post – für das Vertonen von Nachrichten eine eigene Stimme zu casten.

Monetarisierung: „Einen komplizierten Prozess wollen wir vermeiden“

Während die RP laut Bröcker zumindest ihren Aufwecker-Podcast mittlerweile sehr erfolgreich vermarkte, sind die Möglichkeiten der Monetarisierung insgesamt noch nicht weit gediehen. Seit die ARD-Werbetochter A&S begonnen hat, Podcasts in ihr Vermarktungsprogramm aufzunehmen, habe sich in der Branche aber schon einmal etwas bewegt, berichtet Krüger.

Für Medienanbieter können übergreifende Vermarkter von Bedeutung sein. Die Einzelvermarktung gestaltet sich aufgrund nicht allzu hoher Reichweiten unter Umständen schwierig. Hinzu kommt, dass sich Podcast-Konkurrenten ohne Medienunternehmen im Hintergrund durchaus flexibler in der Produktpräsentation zeigen. Wenn Podcast-Moderatoren zugleich Werbeansager sind und unter Umständen noch die Vorzüge eines Produktes loben, ist das medienethisch zumindest diskussionswürdig. Medienanbieter verfahren hier selbst innerhalb der eigenen Formate durchaus unterschiedlich. Während Spiegel Online in seinem Politik-Podcast „Stimmenfang“ die Moderatorin ebenfalls die Werbung sprechen lässt, wird Sascha Lobos Debatten-Podcast bei SpOn von einer Werbestimme begleitet.

Bei T-Online fange man derzeit an, sich mit dem Thema der Monetarisierung zu befassen, sagt Chefredakteur Harms. „Es soll natürlich erkennbar sein, dass es sich dabei um Werbekunden handelt, eine klare Kennzeichnung ist wichtig. Einen komplizierten Prozess, wie er beim Radio vorkommt, wollen wir aber vermeiden.“ Bröcker erklärt, bei der RP laufe vor allem die Vermarktung des morgendlichen Podcasts äußerst zufriedenstellend. Als Vorteil erweist sich derzeit, dass die Plattformbetreiber keine Einschränkungen in der Darstellung vornehmen und die Formate abspielen, wie sie angeboten werden. Also inklusive Werbung.

Über Smart Speaker könnten bald weitere Monetarisierungsmöglichkeiten hinzukommen. Wenn Amazon selbst unter die Vermarkter geht und, wie ein CNBC-Bericht zuletzt andeutete, auch Werbung innerhalb der Skills plant, könnten die Betreiber entsprechend davon profitieren. Amazon hatte entsprechende Vorhaben zwar dementiert, der US-Sender beruft sich aber auf Insider.

In der Monetarisierung hilfreich wäre auch mehr Transparenz, berichtet Krüger. Zwar stelle Amazon bereits Grunddaten wie Skill-Installationen und Abrufzahlen bereit. „Es ist aber nicht so, dass wir morgens eine Tabelle öffnen und alle Zahlen ausgewiesen bekommen.“ Angaben zur Verweildauer, Abruchsquoten, Abrufzeiten oder zur Wiederkehr, gebe es noch nicht. Er sei allerdings nicht pessimistisch: “Als Apple bei iTunes nach Jahren plötzlich mehr Daten zur Verfügung gestellt hat, ging ein Ruck durch die Podcastszene. Wenn andere Anbieter nun erkennen, dass dies die Inhalte auf ihrer Plattform besser macht, kann ich mir vorstellen, dass Amazon in Sachen Transparenz nachlegt.“

Unterdessen befassen sich Redaktionen mittlerweile auch damit, wie smarte Geräte und Sprachsteuerung die eigene Arbeit erleichtern können. Die verbauten Alexa-Mikrofone bei T-Online mögen derzeit noch eher als Gag verstanden werden. Auch geht es sicher darum, sich selbst an die Nutzung zu gewöhnen, mit der Technik zu spielen und zu lernen. Innerhalb Harms‘ Redaktion hat Alexa aber bereits Aufgaben übernommen und erfüllt eine Berichtsfunktion. „Dazu zählt – wie für die Nutzer – die aktuelle Nachrichtenlage, Alexa kennt aber auch unsere Analytics-Daten und kann uns sagen, welche Themen am Vortag gut gelaufen sind und über welche Kanäle wir welche Reichweiten erzielt haben“, erklärt Harms.

Das mag erst der Anfang sein. “Vorstellen kann ich mir eine ganze Menge. Vielleicht kommen wir irgendwann in die Situation, dass Alexa mit unserem CMS gekoppelt ist und Eilmeldungen für uns anlegt“, so eine Vision von Harms. „Natürlich auf Befehl eines Redakteurs.“