Anzeige

Deepfake-Debatte

Bye-bye Stock-Material: Wenn die KI die Assets erzeugt

Nvidia Gaugan

Ufos über dem ländlichen Strand - Die KI schreckt auch vor kreativen Kompositionen nicht zurück - Foto: Nvidia Gaugan / Screenshot

Sie brauchen ein passendes Foto zum neuen Blogbeitrag. Sie würden gerne eine Landschaftsaufnahme verwenden, um einen Social Media Post zum Thema Urlaubssehnsucht zu illustrieren. Ihr Making-Of-Video von der aktuellen Kampagne braucht dringend Hintergrundmusik. Und vielleicht könnte sogar ein animiertes Computermaskottchen die Anmoderation für das nächste Webinar übernehmen.

Anzeige

In jedem dieser Fälle würde der geneigte Marketer vermutlich online gehen, um sich das benötigte Material vom Stock-Anbieter seiner Wahl zu besorgen, oder – im Falle des Maskottchens – nach einer Lösung suchen, die es ermöglicht, einen O-Ton hochzuladen und dafür ein Video zurück zu bekommen, das dem Maskottchen das Gesagte lippensynchron in den Mund legt.

Und in all diesen Fällen stellt sich der geneigte Marketer die Frage nach den Kosten und den Lizenzrechten. Wer ein paar Tausend Follower auf Instagram mühevoll gesammelt hat, wird von Stockanbietern, die Lizenzen nach Traffic-Aufkommen vergeben, oft ziemlich zur Kasse gebeten. Und es kann passieren, dass Ihr Wettbewerber exakt das gleiche Motiv verwendet.  

Nvidia Gaugan
So einfach lassen sich mit Nvidias Gaugan künstliche Landschaften erstellen – Foto: Nvidia / Screenshot

Diese etablierten Kulturtechniken der Medienschaffenden stehen auf dem Prüfstand. Mehr noch: Es droht die größte Umwälzung im Stock-Markt seit der Erfindung des User Generated Content. Leistungsfähige, KI-basierte Werkzeuge erzeugen Assets aus dem Nichts. Und sie erzeugen nicht ein Asset, sondern Hunderte. Der Marketer hat die freie Wahl, welches Motiv ihm am besten gefällt. Und bei vielen Services bezahlt er nichts für die Nutzungslizenz. Und bei Bildern virtueller Personen muss er sich nicht einmal Sorgen machen um die Persönlichkeitsrechte.  

Hier elf Beispiele zum Ausprobieren und Staunen:

1. Googles 3D-Szenen-Generator

Ein neuer 3D-Generator von Google macht aus einem 2D-Objekt oder Foto eine 3D-Szene. Solche Tools gibt es schon länger, aber die Qualität der meisten ist mäßig. Entscheidend ist, dass sich die Beleuchtung verändert, wenn man die Perspektive wechselt. Das bedeutet, dass sich alle Schatten und Lichtreflexe im Bild mit ändern. Der Finne Peter Hedman hat für die Google Research Labs eine Technologie entwickelt, die genau das kann. In hoher Qualität und in Echtzeit.

Und was hat das mit Marketing zu tun? Ziemlich viel. Der Marketer kann aus eigenen Fotos 3D-Szenen oder Objekte erzeugen, die sich in jeden virtuellen Hintergrund einstanzen lassen. Und zwar in sehr hoher Qualität. Das Ergebnis kann er als zweidimensionales Bild für den Blogpost ausgeben, als Animation für ein Video-Intro oder als AR-Filter (Augmented Reality) in Snapchat posten.

2. Nvidias Landschaftsgenerator Gaugan

Peter Hedman kam vom Grafikspezialisten Nvidia zu Google. Und er hat schon dort an 3D-Generatoren gearbeitet. Der berühmteste ist „Gaugan“, benannt in Anlehnung an den französischen Maler Gaugin. Mit wenigen Strichen malt man Skizzen, die von der KI zu Landschaften umgerechnet werden. Und diese Bilder können frei verwendet werden, beschreibt Nvidia in seinen AGB.

3. DeepFaceLab

Das ist die Software hinter dem Merkel-Fake. Ihr Macher behauptet, sie sei die beste auf dem Markt. Und sie kann beliebig Gesichter mischen. So kann – wie im Falle Tibber – eine Schauspielerin der Kanzlerin Mimik und Stimme leihen. Das Tool legt dann die Gesichtszüge der Regierungschefin darüber.


Lesen Sie den Kommentar von Luca Schallenberger über den Merkel-Deepfake


4. Loudly

Ist der KI-Komponist der Tod der Anbieter von Stock-Audio? Nicht, wenn es nach Loudly geht, denn dort wird der KI-Komponist demnächst zum Premium-Paket gehören. Lizenznehmer können dann nicht nur aus den existierenden Tracks wählen oder diese modifizieren wie bisher. Sie können auch gänzlich neue und einzigartige Musik erstellen.

Rory Kenny, CEO von Loudly

„Die KI ermöglicht mit Nicht-Musiker:innen auch einem ganz neuen Publikum, qualitativ hochwertige Musik zu kreieren – und das, ohne Tausende von Stunden in musikalisches Training investieren zu müssen“, sagt Loudly-CEO Rory Kenny auf Anfrage von MEEDIA.

5. Open AI – Dall-e

Sie brauchen ein Foto von der Golden Gate Brücke, um über ein Startup aus San Francisco zu berichten? Kein Problem. Dall-e, dessen Name eine Verbindung aus Salvador Dali und Wall-e (dem Filmroboter)  darstellen soll, generiert aus Texteingaben Bilder. Sie wollen eine Schnecke, die wie eine Avocado aussieht? Sie benötigen 30 „Fotos“ von chinesischem Essen? Alles da.

Dall-e
Inspiration oder Asset? Dall-e erzeugt Bilder aus Keywords – Foto: Dall-e / Screenshot

6. RunwayML – Hilfe für Kreative

Wer nicht alle Arbeit der Maschine überlassen will, dem kann die KI Routinetätigkeiten abnehmen und die Arbeit dadurch signifikant erleichtern. RunwayML bietet den zahlenden Kunden direkt Zugriff auf die KI. Dadurch kann man eigene Modelle trainieren und komplett neue Funktionen freischalten.

Es gibt aber auch eine Handvoll fertiger Tools, die man einfach nutzen kann. Im Zentrum steht der Freisteller. Mit einem sehr einfachen Maskierungswerkzeug, löst man zum Beispiel eine Person aus einem Video. Das Ergebnis ist ein Greenscreen-Video, das dann wieder vor jedem beliebigen Hintergrund eingesetzt werden kann. Natürlich können Sie auch direkt vor Greenscreen filmen, aber mit RunawayML geht das viel einfacher und auch mit bereits existentem Material.

Weitere Tools entfernen störende Objekte aus Bildern oder färben Schwarzweiß-Bilder neu ein.

7. AutoDraw – Cliparts und graphische Elemente

Schon vier Jahre hat das Experiment Autodraw von Google auf dem Buckel. Doch es funktioniert weiterhin. Ähnlich, wie bei Nvidias Gaugun, setzt auch Autodraw kleine Skizzen in Grafiken um. Diese Grafiken kommen aus einer riesigen Bibliothek. Es ist also eine Art Autokorrektur für schlechte Zeichner.

Freilich ist der Einsatzbereich von Cliparts und Vektorgrafiken begrenzt, aber wer seiner Powerpoint-Präsentation bestimmte Effekte verleihen möchte oder Social Media Posts mit eigenen Emojis ausstatten will, wird hier fündig. Das System ist web-basiert, kann also auch mit dem Smartphone „bemalt“ werden.


Seit dem Merkel-Spot von No Try Agency läuft die Debatte um Deepfakes wieder heiß. Lesen Sie weiter:

Obama Deepfake

8. Headlime – Automatische Überschriften

Headlime ist buchstäblich eine Schreibmaschine. Und zwar eine für Überschriften und kurze Texte. Auch hier ist der Übergang zwischen Hilfsmittel und eigenständiger Automatik fließend. Autoren können Headlime ein paar Stichworte geben und die Maschine erzeugt mehr oder weniger sinnvolle Sätze daraus. Es steht dem Autor frei, das direkt zu benutzen oder sich nur inspirieren zu lassen.

9. ClipDrop – „Echte“ Objekte in Powerpoint einfügen  

Die App ClipDrop ermöglicht Ihnen, einen beliebigen Genestand zu fotografieren und dann direkt als freigestelltes Objekt in eine Präsentation einzufügen. Soweit ist das nicht spektakulär, aber die App verfügt über 3D-Daten des fotografierten Objekts und kann es so in Größe und Perspektive an ein bestehendes Bild anpassen. Man kennt die Funktion aus dem Ikea-Katalog, nur dass es sich hier nicht um vorgefertigte 3D-Modelle handelt.  

10. Der sprechende Avatar

Je fotorealistischer ein 3D-Charakter ist, umso eher kann er einen echten Menschen ersetzen. Es gibt jede Menge Tools, von Voki, für den Einstieg (Comic-Stil) bis SitePal (fotorealistisch). Das derzeit größte Projekt dieser Art steht kurz vor dem Launch und kommt aus Südkorea. Samsung hat die Firma Neon ausgegründet. Und die soll tatsächlich digitales Servicepersonal zur Verfügung stellen, dem per Texteingabe eine beliebige Aussage mitgegeben wird (auch durch einen Chatbot) und daraus entsteht ein realistisch wirkendes Video mit künstlichen Darstellern.

Noch ist die Beta nur einigen ausgewählten Partnern zugänglich, aber man kann sich auf eine Warteliste setzen lassen.

11. Dieser Mensch, Katze, Hund existiert nicht

ThisPersonDoesnotexist ist ein Porträt-Service. Laien können hier keinen Unterschied zwischen realen Menschen und den Schöpfungen der KI erkennen. Dagegen kann sich der Marketer mit ziemlicher Sicherheit darauf verlassen, dass er mit einem solchen Bild keine Persönlichkeitsrechte verletzt. Ziemlich sicher, denn es gibt schon eine Reihe von Medienberichten, wo sich Menschen beklagen, sich in dieser Bibliothek wiedererkannt haben.

Anzeige