Anzeige

Gastbeitrag

Zählen, was zählt – über den Gender Data Gap und sexistische Algorithmen

Katharina Schüller – Foto: E+A Fotografie

Daten, Algorithmen und KPIs können Unternehmen richtig Schaden zufügen. Zumindest, solange sie messen, was gezählt werden kann und nicht was zählt. Woher das kommt und warum das so ist, beschreibt Katharina Schüller, Gründerin der Beratung Stat-Up in einem Gastbeitrag für MEEDIA.

Anzeige

Von Katharina Schüller

„Die AppleCard ist so ein verdammt sexistisches Programm“, twitterte vor ziemlich genau zwei Jahren – ausgerechnet – ein Mann. David Heinemeier Hansson, ein dänischer Programmierer und Autor des populären Web-Frameworks Ruby on Rails, dem Klischee nach also ein typischer Nerd. DHH, wie er sich auf Twitter nennt, empfahl seinen rund 400.000 Followern, ernsthaft über die impliziten Annahmen hinter Black-Box-Algorithmen, Verzerrungen und Kundenservice nachzudenken. Was war da los?

Heinemeier Hansson und seine Frau hatten beide jeweils eine Kreditkarte von Apple beantragt. Mit langjähriger Ehe in Gütergemeinschaft und mit gemeinsamer Steuererklärung. Doch der Black-Box-Algorithmus hinter Apples Scoring-System hatte ihm das 20-fache Kreditvolumen eingeräumt wie seiner Frau. Keine Beschwerde half. Der Kundenservice reagierte mit Achselzucken; schließlich hatte ein Algorithmus entschieden und damit war die Entscheidung (scheinbar) objektiv. „Ich bin überrascht, dass sie überhaupt eine Kreditkarte ohne schriftliche Zustimmung ihres Ehemannes beantragen konnte“, kommentierte ebendieser Ehemann sarkastisch, denn „mal ehrlich, kann man heutzutage einer Frau mit Kreditkarte wirklich trauen?“

Zur Person

Katharina Schüller ist Geschäftsführerin und Gründerin von Stat-Up, einer in München und Madrid ansässigen Unternehmensberatung, die auf Statistical Consulting und Data Science spezialisiert ist. Als Expertin für Digitalisierung und Data Analytics hat die studierte Psychologin und Statistikerin mehrere Beiratsmandate in der Wirtschaft, wie beispielsweise bei der Deutschen Bank oder bei BurdaForward und in politischen Gremien inne. Außerdem lehrt sie an verschiedenen Hochschulen und veröffentlicht regelmäßig Fachbeiträge in Printmedien sowie und Funk und Fernsehen.

Das ist nicht das einzige Beispiel dafür, wie mangelndes Bewusstsein für Gendergerechtigkeit, oder allgemeiner für Diversity, einer Marke erheblich schaden kann. Weithin bekannt ist das Beispiel Amazon. Der Internet-Gigant hatte den Versuch unternommen, Bewerbungsprozesse mit Hilfe von KI-Anwendungen neutraler zu gestalten, da angenommen wurde, diese seien – anders als Beurteilungen durch menschliche Interviewer – frei von versteckten Vorurteilen. Aber manchmal ist gut gemeint eben das Gegenteil von gut: Passiert ist das genaue Gegenteil. Das Experiment scheiterte recht rasch, als sich herausstellte, dass die algorithmenbasierte Auswahl Frauen im Bewerbungsprozess benachteiligte. Grund hierfür war schlicht ein verzerrter Datensatz. Aus Vergangenheitsdaten hatten die (von Männern entwickelten) Algorithmen gelernt, dass männliche Bewerber eine höhere Chance auf einen Arbeitsvertrag hatten. Da die KI-Anwendung die Aufgabe hatte, diejenigen Kandidaten herauszufinden, die mit hoher Wahrscheinlichkeit später eingestellt würden, war es für die Software nur logisch, die anderen gar nicht erst einzuladen. Die Folge: Bewerbungen von Frauen, älteren Kandidaten oder solchen, die auf andere Weise von der Blaupause des jung-dynamischen, weißen, männlichen Entwicklers abwichen, wurden gnadenlos aussortiert.

Solche klaren Fälle von Diskriminierung können ganz offensichtlich die beste Marken- und Werbekommunikation nachhaltig schädigen. Aber es reicht heute längst nicht mehr, nicht zu diskriminieren. Zunehmend rückt die Bedeutung von Diversity als wesentlicher Treiber einer zukunftsorientierten Marketing- und Kommunikationsstrategie in den Blickpunkt von Entscheidern. Und eins ist klar: Die Ambitionen sind groß und die Erwartungen hoch. Denn mehr Diversity steht wissenschaftlichen Untersuchungen gemäß sowohl mit besseren Entscheidungsfindungsprozessen als auch mit höheren Kapitalrenditen in Zusammenhang. Das liegt nicht nur an unternehmensinternen Effekten.

Vielmehr lassen sich auch außerhalb der Organisationen positive Effekte eines erhöhten Diversity-Bewusstseins beobachten. 64 Prozent der Verbraucher sind eher bereit, ein Produkt in Erwägung zu ziehen oder gar zu kaufen, nachdem sie eine Werbung gesehen haben, die sie als vielfältig beziehungsweise inklusiv wahrnehmen. Catalyst, ein Think-Tank mit dem Motto „Workplaces that work for women“, hat insgesamt 39 verschiedene positive Effekte von Diversity aus internationalen Studien zusammengestellt, die Zusammenhänge mit höherer finanzieller Performance, einer verbesserten Ausschöpfung des Talentpotenzials, verbesserter Corporate Governance und Reputationssteigerungen sowie erhöhter Innovationsfähigkeit ausfindig machen.

Aber derartige Veränderungen sind eben häufig auf eine Vielzahl von Maßnahmen zurückzuführen, und nur weil sie mit diesen zeitlich korrelieren, ist nicht gesagt, dass eine echte Ursache-Wirkungs-Beziehung vorliegt. Diversity-Maßnahmen stehen deshalb vor der Herausforderung, ihren Erfolg transparent darstellen zu können. Dazu braucht es KPIs, denn bekanntlich lässt sich nichts steuern, was nicht gemessen wird. Und dazu wiederum braucht es Datenkompetenz, die mit der Frage anfängt, was man überhaupt messen will: Was zählt eigentlich als „Erfolg“?

Beim Thema Messen denken wir meist gleich an Zahlen, Daten, Fakten. In der Praxis bedeutet das oft eine recht starke Vereinfachung durch rein quantitative KPIs. Dabei müsste jedem sofort klar sein, dass einzelne KPIs wie der Anteil diverser Gruppen unter den Neueinstellungen, Kündigungen oder Beförderungen für sich allein kaum Aussagekraft über die Inklusivität einer Unternehmenskultur besitzen. Denn es geht nicht um den Output von Maßnahmen. Es geht nicht darum, wie viele Menschen eine divers gestaltete Werbebotschaft gesehen haben und ob sie ihnen gefallen hat. Es geht darum, ob sich ihre Einstellungen verändern und damit die Lebensrealität der Zielgruppen. Es geht also um den Impact auf die gelebte Kommunikationskultur und damit auf die Außenwirkung einer Marke.

„Typische KPIs wie etwa die Verteilung der Protagonisten in Werbeanzeigen nach Geschlecht oder Alter oder die Sichtbarkeit von Minderheiten messen aber genau eins nicht: den Impact.“

Typische KPIs wie etwa die Verteilung der Protagonisten in Werbeanzeigen nach Geschlecht oder Alter oder die Sichtbarkeit von Minderheiten messen aber genau eins nicht: den Impact. Diese KPIs verändern sich zwar mit hoher Wahrscheinlichkeit, wenn Diversity-Maßnahmen Wirkung zeigen und sich dadurch Einstellungen, Verhalten und Lebenslage der Zielgruppen ändern, aber aus der Veränderung der KPIs selbst folgt nicht zwingend eine Wirkung der Maßnahmen auf die Lebenssituation. Schlimmstenfalls wird eine Veränderung der KPIs selbst zum Ziel und es treten negative Effekte auf, weil Fehlanreize gesetzt werden. Zu den Risiken und Nebenwirkungen von Werbung, die Minderheiten ins Rampenlicht setzt, gehört der Glaubwürdigkeitsverlust, wenn die werbende Organisation als wenig divers wahrgenommen wird. Wenn Sein und Schein nicht zusammenpassen – und um das aufzudecken, reicht ein entlarvender Kommentar eines Mitarbeiters auf der Bewertungsplattform Kununu – dann bricht die ganze schöne Diversity-Fassade zusammen.

Komplexe Diversity-Maßnahmen lassen sich nicht mit einfachen KPIs messen, weil sie häufig in sehr vernetzten Strukturen umgesetzt und mit ihnen unterschiedlichste Zielgruppen angesprochen werden, gegebenenfalls auch über die Organisation hinaus. Dies betrifft zum Beispiel Kunden, Lieferanten oder auch die Öffentlichkeit, die eine mangelnde Diversity-Sensibilität von Organisationen in Social Media Plattformen diskutiert.

Der große Schwachpunkt der meisten rein quantitativen KPIs ist dabei, dass sie bloß den Output der Kommunikation messen. Das hat viel damit zu tun, dass entsprechende Zahlen und Daten oft einfach verfügbar sind. Und dass sich diejenigen, die daraus KPIs entwickeln, keine Gedanken darüber machen, dass Output eben nicht gleich Impact ist. Weil ihre Lebensrealität davon gar nicht betroffen ist.

Beispielsweise wird in Bezug auf Werbeanzeigen zwar üblicherweise erhoben, wie viele solcher Anzeigen im Netz eingeblendet wurden, wie viele Menschen darauf geklickt und anschließend ein Produkt gekauft haben. Das belegt, dass Aktivitäten stattgefunden und die Zielgruppen erreicht wurden. Können die Adressaten aber eigenständig erkennen, welche Werbebotschaften inklusiv sind und welche nicht, abgesehen von klar sexistischen oder rassistischen Anzeigen? Wollen sie das überhaupt und erkennen sie das Problem? Suchen sie aktiv nach neuen Perspektiven und ändern sie ihr Konsumverhalten? Gelingt es umgekehrt einem Unternehmen, Menschen unterschiedlicher Lebenshintergründe zu mehr Partizipation zu bewegen, damit die Unternehmenskultur diverser zu gestalten und ein glaubwürdiges Image als inklusive Organisation aufzubauen und zu transportieren? Das wird praktisch nie systematisch evaluiert.

„Wir müssen uns kritisch damit auseinandersetzen, was zählt.“

„Nicht alles, was zählt, kann gezählt werden, und nicht alles, was gezählt werden kann, zählt“, hat Albert Einstein gesagt. Deswegen müssen wir uns kritisch damit auseinandersetzen, was zählt; welche Werte uns als Gesellschaft wichtig sind und welche Rolle Diversity dabei spielt: Macht mehr Diversity die Menschen glücklicher und zufriedener? Oder kann sie auch Ängste und Verunsicherungen befördern? Führt mehr Diversity zu mehr Chancengerechtigkeit und wer muss dafür liebgewonnene Privilegien aufgeben? Wie können wir als Individuen und als Gesellschaft lernen, derartige Veränderungen auch auszuhalten?

Antworten auf diese Fragen sind alles andere als einfach. Sie erfordern ein hohes Maß an konstruktiver Skepsis. Auch dann ist nicht garantiert, dass wir die erwünschten Wirkungen tatsächlich erreichen. Aber es hilft mit Sicherheit nicht, einfache Antworten mit einfachen KPIs zu suchen, die eben mit hoher Wahrscheinlichkeit nicht das zählen können, was zählt.

Anzeige