Titelbild: Fotolia Stockfoto – #144751364 / EinBlick

Algorithmus erkennt euer Konsumverhalten anhand von Facebook-Daten

Könnt ihr euch vorstellen, dass ein Algorithmus euch anhand von etwa 100-150 Dingen und Postings, die ihr bei Facebook mit „Gefällt Mir“ markiert habt, besser einschätzen kann als Menschen, die euch so nahestehen wie beispielsweise ein bester Freund, oder eine beste Freundin? Nein? Doch! Zumindest legen aktuelle Studien diese Vermutung nahe. Möglich macht das ganze angeblich das sogenannte Ocean-Modell, welches eure Persönlichkeit anhand von 5 messbaren Faktoren definiert. Und das sehr erfolgreich und zuverlässig. Zumindest behaupten das jene Firmen, die es anwenden. Die neueste Entwicklung dieser Technik soll es nun möglich machen, das Konsumverhalten bei Drogen und Alkohol zuverlässig zu analysieren. Dafür wurden vor kurzer Zeit etwa 11.000.000 Facebook-Accounts „testweise“ analysiert. Aber lasst uns ganz von vorne beginnen.

Wer sofort und ohne Vorgeschichte lesen möchte inwieweit die neueste Aussage, dass Algorithmen euer Konsumverhalten anhand von Facebook-Daten analysieren können zutrifft, der sollte HIER klicken.

Die "Big Five" der Persönlichkeitsmerkmale - Das Ocean Model - Bild: Wikipedia
Die „Big Five“ der Persönlichkeitsmerkmale – Das Ocean Modell – Bild: Wikipedia



Cambridge Analytica & Big Data

Einige von euch wissen vielleicht, dass ich im Online-Marketing arbeite. Jeden Tag habe ich dort mit Analysewerkzeugen und Studien zu tun, die allesamt nicht mehr tun als euer Verhalten im Internet zu analysieren, um daraus Profit zu machen. Und das ist auch nicht grundsätzlich schlecht. Je nachdem, für wen und vor allem wie man arbeitet. Ich sage oft, dass ich alles über die Besucher und Zielgruppen weiss, außer ihren Namen und ihre Adresse. Alter, Geschlecht, Endgerät, Vorlieben, Einkommensgruppe, Lieblings-Websites, Lieblings-Musik, „Träume“ – alles transparent einsehbar. Geordnet nach Postleitzahl-Angaben und Persönlichkeitsmerkmalen. Oder eben nach allen erdenklichen anderen Kriterien, die eine Person definieren können. Dafür muss man nichtmal Unternehmer sein, sondern braucht nur eine eigene Website.

Ob das gut oder schlecht ist hängt davon ab, womit man diesen Profit machen möchte und definitiv wären auch die positiven Aspekte unserer heutigen Zeit ohne diese Werkzeuge kaum möglich. Das beweist schon alleine ein Name: Google, mittlerweile soviel mehr als nur eine Suchmaschine.

In der Anfangszeit meines Berufes habe ich eine Selbstexperiment durchgeführt und mir ein Quartal lang alles notiert, was ich gegoogelt habe. Heute weiss ich, dass man das sowieso alles offiziell einsehen kann. Es war erschreckend. Wirklich. Probiert’s aus. Inklusive Bewegungsprofil.

Viele von uns vertrauen Google ihr Innerstes an, denn wonach wir suchen zeigt, was uns bewegt. Und das können teilweise sehr aussagekräftige Dinge sein. Websites wie Google Trends fassen übrigens alle Suchanfragen weltweit zusammen und haben es so schon ermöglicht, die Ausgänge von Wahlen und dem Eurovision Song Contest erfolgreich vorherzusagen. Nur anhand der Suchanfragen, die Menschen auf der ganzen Welt stellen.

Die Häufung an Suchanfragen zur Wahl ist sehr gut zu erkennen. Außerdem sieht man, wo die Leute am meisten nach ihm suchten.
Die Häufung an Suchanfragen zur Wahl ist sehr gut zu erkennen. Außerdem sieht man, wo die Leute am meisten nach ihm suchten. Seht euch das Tool selber an.

Und dieses Tool ist nur die Light-Version dessen, was Menschen und vor allem Unternehmen und auch Regierungen möglich ist, wenn sie dafür ordentlich zahlen. Diejenigen unter euch, die vllt. auch ein wenig mehr mit IT zu tun haben können sich vorstellen, wozu diese grundlegende Technik, wenn man sie entsprechend anpasst und weiterentwickelt, verwendet werden kann.

Kein Wunder also, dass findige ITler, Analysten und Werber diese Methoden täglich weiterentwickeln und mittlerweile Erstaunliches und Beängstigendes damit anstellen können. Das beste Beispiel ist der Einfluss von Big Data auf den Wahlerfolg Trumps, der natürlich auf mehr als auf einer Säule fusst. Aber eine dieser Säulen ist definitiv Cambridge Analytica. 2017 hat der Chef des Unternehmens übrigens auf der Online-Marketing-Rockstars Messe hier in Hamburg gesprochen und überhaupt keinen Hehl aus der Unternehmenspraxis gemacht. Und auch nicht daraus, wozu diese Praxis das Unternehmen befähigt, oder zumindest befähigen könnte; die Beeinflussung von Wahlergebnissen, z.B. bei der Präsidentschaftswahl, oder beim Brexit-Votum. Klar, ein bisschen Eigenwerbung ist immer dabei und sicher entscheidet eine Methode keine Wahl. Aber sie beeinflusst sie. Und zwar unheimlich präzise.

Das Neue sind nicht die Algorithmen an sich, sondern die Verknüpfung all‘ dieser separat vorhandenen Daten, das Big Data Management, das anschließend ins sogenannte „Machine Learning“ übergeht. Also die Verbindung zwischen Google-Suchanfragen und Social-Media Konten einer Person, so wie die Verknüpfung mit zahlreichen Offline-Daten, Telefondaten usw. und die anschließende automatische Reaktion eines Algorithmus auf diese Daten, wie das Ausgeben von Werbebotschaften, automatische Werbeanrufe usw. Aber nicht für jeden dieselbe, so wie bisher.

Bei Cambridge Analytica arbeiten sog. „Targeting-Spezialisten“. Im Endeffekt sind das Menschen die genau wissen was jemand hören will und wie man Menschen auf unzählige verschiedene Wege zur selben Entscheidung bewegt. Immer angepasst auf die Persönlichkeit des Einzelnen. Big Data, Social Media und Google machen es möglich.

  • 10 Likes reichen, um auf dem gleichen Level zu schätzen wie ein Arbeitskollege
  • 70 Likes sind nötig, um jemanden so gut zu beurteilen wie ein Mitbewohner oder Freund
  • 150 Likes benötigt das Programm, um so akkurat zu sein wie ein Familienmitglied
  • 300 Likes um so gut zu schätzen wie der Partner

Kurz erklärt: Das Geschäftsmodell von Cambridge Analytica basiert auf der Annahme, dass Menschen beeinflussbar sind, wenn man sie medial richtig anspricht: Wer als ängstlich-introvertiert eingestuft wird, dem verkauft man eine Waffe eher als Versicherung gegen Einbrecher, sagen die Targeting-Experten. Wer als konservativ-extrovertiert gilt, bekommt Bilder von der Entenjagd vorgesetzt. Im Optimalfall stuft man jeden Werbespot noch farblich so ab, dass er zum Persönlichkeitsprofil des Rezipienten passt. (Quelle: Zeit.de)

Im Endeffekt bedeutet das den Wechsel von dem Modell „eine Werbebotschaft für alle“ hin zum Modell „eine individuelle Werbebotschaft für jeden“. Möglich machen das all‘ die Suchanfragen und Spuren in sozialen Netzwerken, die jeder von uns hinterlässt. Im Bereich der Produktwerbung ist das gar nicht schlimm, kann uns sogar wirklich dabei helfen Dinge zu finden, die uns wirklich interessieren. Aber man kann das Modell eben auch auf die Politik anwenden, oder dazu Menschen gezielt zu manipulieren und sie gleichzeitig von gewissen Botschaften auszuschließen. Zensur im Geheimen.

Beispiel: ein Rassist, identifizierbar an seinen Gruppen-Mitgliedschaften auf Facebook, oder anhand seiner Suchanfragen, bekommt eine Meldung angezeigt, in der Trump die Mauer zu Mexiko ankündigt. „Den wähle ich“, denkt die Person sich nun. Ein friedliebender Pazifist hingegen, der keine rassistischen Ansichten vertritt, bekommt die Meldung angezeigt „Trump wirbt für friedliche Beziehung zu Russland“, aber niemals die Meldung „Trump will Mauer zu Mexiko bauen“. Doch ausgegeben werden ALLE Meldungen von ein und derselben Firma – Cambridge Analytica. Insgesamt soll es im Trump-Wahlkampf bis zu 100.000 verschiedene Newsmeldungen gegeben haben, jeweils abgestuft auf die Persönlichkeitsprofile von 220 Millionen (!) US-Amerikanern, die die Firma angeblich u.a. auch durch Facebook-Daten erstellt hat. 

Im Prinzip ist das Ganze nicht mehr als herkömmliche Werbung. Nur die Daten, auf denen die Werbebotschaften basieren, werden immer detaillierter und immer persönlicher. Das ermöglicht ein schier unvorstellbares Maß an Manipulation. Und das „beste“ daran; ohne eure Mitarbeit würde das nie funktionieren. Denn woher kriegen diese Firmen eure persönlichsten Angaben und Daten?

Aus den allseits beliebten Quatsch-Umfragen bei Facebook:

  • Welcher Simpsons Charakter bist du?
  • Welche Märchenfigur bist du?
  • Finde heraus, welcher Typ Frau auf dich steht!
  • Welcher Freund wird mit dir alt?
  • usw. – ihr kennt sie alle.

Diese angeblich zwanglosen und lustigen Tests verlangen komischerweise Zugriff auf sehr, sehr viele eurer Facebook-Daten. Allen voran eurer Likes und eurer Freundesliste. Anschließend müsst ihr eine Reihe sehr persönlicher Fragen beantworten. Sicher denkt ihr, die Antworten kriegt nie jemand zu sehen. Falsch gedacht. Zahlreiche Firmen bauen genau darauf ihr Geschäftsmodell auf. Auf dem Verkauf eures Persönlichkeitsprofils.

Zum Abschluss noch ein spannender Beitrag zum Thema: Beitrag auf Spiegel.de

Und wie kann so ein Algorithmus nun mein Konsumverhalten erkennen?

Zugegeben, bei vielen braucht man gar keinen komplizierten Algorithmus, um das Konsumverhalten zu erkennen, da sie gerne damit hausieren gehen. Auch Profil- und Titelbilder sagen oft mehr als tausend Worte. Einige mögen außerdem sagen „Na und, damit kann doch eh keiner was anfangen“. Möglich, im Moment noch nicht. Aber stellt euch nur die zukünftigen Verkehrskontrollen vor, oder das Interesse eurer Krankenversicherung an solchen Daten. Vielleicht in 10 Jahren, vielleicht in 20. Dann werden auch Privatunternehmen und Behörden Zugriff auf den gesamten Datenschatz dieser Unternehmen haben. Wenn sie zahlen. Umso besser zu wissen, wie genau das funktioniert. Und eine Grundregel gilt sowieso; je weniger Persönliches ihr im Internet angebt, desto besser.

Wer gerne Alkohol, Tabak oder Drogen konsumiert oder sie missbraucht, der zeigt laut Forschung bestimmte Verhaltensmuster, die über das Facebook-Profil und die Nutzungsgewohnheiten der Plattform abgelesen werden können. Dabei geht es nicht nur um eure Likes, sondern um die Nutzungszeiten, die Abstände zwischen den Nutzungen, die Scroll- und Lesegeschwindigkeit, die Interaktionen und die angeklickten Seiten und Links. Daraus können Wahrscheinlichkeiten (ich möchte das Wort „Vorhersagen“ meiden) berechnet werden. Zum Beispiel wie wahrscheinlich es ist, dass jemand, der Morgens um 05.00 Uhr das erste mal eingeloggt ist und Nachts um 03.00 Uhr das letzte mal, unter dem Einfluss von Koffein oder anderen Aufputschmitteln steht. Nun fehlt noch die Regelmäßigkeit dieses Nutzungsverhaltens und schon kann man erste Vermutungen zum Konsumverhalten aufstellen. Diese werden dann angereichert mit Musikrichtungen, Filmen und Gruppen, die dem jeweiligen Nutzer gefallen. Wie gesagt, schon 10 Likes reichen aus, um euch so gut einzuschätzen wie ein Arbeitskollege. Und viele von uns hinterlassen wesentlich mehr. Pro Tag.

Das ist ein Ergebnis einer Untersuchung von Wissenschaftlern des Addiction Recovery Research Centers in Roanoke, Virginia. Dazu nutzten die Forscher Verfahren des weiter oben bereits angesprochenen maschinellen Lernens und werteten so große Textmengen und Datenmengen aus. Auch die „Likes“ und die „Status-Updates“ spielen eine große Rolle, ebenso wie Tag und Uhrzeit, an denen sie gemacht wurden. Damit konnte ein Erkennungssystem entwickelt werden, um Menschen aus der Menge der Facebook-Nutzer zu filtern, die mit hoher Wahrscheinlichkeit Drogen zu sich nehmen und zum Missbrauch neigen. Das ist also das Neue an dieser Arbeit; es geht nicht darum, allgemeine Konsumenten zu erkennen oder Menschen, die sich ausprobieren. Es geht darum Menschen zu identifizieren, die zu Missbrauch neigen. Und paradoxerweise können solche Daten äußerst missbräuchlich verwendet werden. Der harmloseste Fall wäre hier noch das gezielte Schalten von Werbeanzeigen für Entzugsprogramme.

Ja, Bild ist klischeemäßig. Aber Fotos lockern einen langen Textbeitrag auf :-D
Ja, Bild ist klischeemäßig. Aber Fotos lockern einen langen Textbeitrag auf 😀

Im Westen nichts Neues

Die neue Studie bestätigt letztendlich nur die Ergebnisse früherer Studien aus dem Jahr 2012, die bereits zeigen konnte, dass der Konsum von Alkohol, Tabak und Drogen aus der Analyse von Facebook-„Likes“ vorhergesagt werden kann. Doch die dieses mal zu Testzwecken herangezogenen Daten erlauben noch viel aussagekräftigere Statistiken und Ergebnisse, denn die analysierte Menge an Facebook-Daten übertrifft die alten Studien um Längen: Alle(!) „Likes“ von insgesamt elf Millionen Facebook-Nutzern und zusätzlich 22 Millionen „Status-Updates“ von 150.000 Facebook-Nutzern wurden verwendet und den Algorithmen zum Lernen vorgesetzt.

Ziel ist es vor allem Menschen mit einer sog. substance use disorder (SUD, psychische oder Verhaltensstörung bei Drogennutzung) zu identifizieren. Solche Personen können bei Konsum von Alkohol und weiteren Substanzen nicht nur eine Abhängigkeit entwickeln, sondern auch Verhaltensstörungen. Das angebliche Ziel der Studie war es primär, im Wege des maschinellen Lernens eine Vorhersagemethode zu finden, um aus ihren Facebook-Nachrichten diejenigen berechnen zu können, die an einer solchen SUD leiden. Dabei konnten im Umkehrschluss aber auch Erkenntnisse gewonnen werden, wie sich Alkohol oder andere Drogen auf das Nutzungsverhalten bei Facebook auswirken.

Ist das die Zukunft der Drogenforschung?

Das Hauptziel scheinen die Wissenschaftler erreicht zu haben: das Finden algorithmischer Lernmethoden, um den großen Datensatz der Facebook-Nutzer inklusive der „Likes“ und „Status-Updates“ zu analysieren, die aber nicht zeitgleich durch Menschen überwacht werden. Das große Ziel ist es, wie bei Cambridge Analytica, eine vollständig automatisierte Methode zu entwickeln, Menschen in Echtzeit zu analysieren und dann automatisch entsprechend angepasste Botschaften zu streuen. Hierbei mag es nun um Drogen gehen, aber im Endeffekt ist das zu jedem Sachverhalt, jedem Produkt, oder jeder Krankheit möglich, die wir uns vorstellen können. In diesem Fall sollen auf dem Machine Learning basierende SUD-Vorhersagemodelle entwickelt werden, deren Resultate für eine anschließende menschliche Analyse nutzbar sind.

Das war durchaus erfolgreich: für alle untersuchten SUD-Arten konnten jeweils über achtzig Prozent Vorhersagegenauigkeit erreicht werden. Die besten der entwickelten maschinellen Lernmethoden konnten mit einer Genauigkeit von 86 Prozent Tabaknutzung vorhersagen. Für Drogenkonsum konnte eine Treffgenauigkeit von 84 Prozent erreicht werden, für Alkohol 81 Prozent.

Fazit der beteiligten Forscher:

We believe social media is a promising platform for both studying SUD-related human behaviors as well as engaging the public for substance abuse prevention and screening.

(Soziale Medien sind unserer Auffassung nach eine vielversprechende Plattform, um menschliche Verhaltensweisen im Zusammenhang mit SUD zu studieren sowie um die Öffentlichkeit über den Missbrauch von Substanzen zu informieren, diesen sichtbar zu machen und Prävention zu leisten.)

Was sagen die Betroffenen dazu?

Warum dieser Artikel? Weil ich es interessant finde zu zeigen wie ein Algorithmus Zusammenhänge rechnerisch konstruiert und über große Datenmengen hinweg zu Aussagen mit hoher Genauigkeit bringen kann. Denn für viele ist diese Gefahr immer noch abstrakt. Was soll jemand schon davon haben zu wissen, was ich like? Wer sollte an meinen Daten interessiert sein? Funktioniert das ganze wirklich? Ja, das tut es und zwar mit viel weniger Anhaltspunkten als viele von euch jetzt denken mögen. Es wurden zum Beispiel Schlüsselbegriffe genutzt, die aus Vergleichsgruppen von Menschen mit Verhaltensstörungen aufgrund von Missbrauch von Drogen, Alkohol oder Tabak stammen und zu den jeweiligen Störungen mathematische Korrelationen aufweisen.

Das sind zum Beispiel Schimpfwörter wie „fuck“ und „shit“, das Beschreiben des eigenen Körpers oder emotionalen Zustands mit Worten wie „hate“, „kill“, „blood“ und „pain“, sowie Wörter mit sexuellem Bezug, z.B. „horny“ und „sex“. Zusätzlich wurden kulturelle Präferenzen hinzugezogen, etwa Musik, Filme oder Unterhaltungsaktivitäten. Hier kommen also die Likes ins Spiel und sicher auch der Abschnitt der euch nun schlagartig am deutlichsten machen wird, wie schnell man selbst in dieser Analyse landen kann. Ein Film wie „V for Vendetta“ ist beispielsweise positiv korreliert zu Alkoholkonsum, wohingegen etwa eine Vorliebe zu Trickfilmen negativ korreliert ist, also die Wahrscheinlichkeit gering ist, dass der entsprechende Facebook-Nutzer zu der Substanz greift.

Hier das Fazit von Netzpolitik.org, das ich nicht besser hätte ausdrücken können: Die Forschung ist der Prävention von Drogenkonsum gewidmet, jedoch braucht man wenig Phantasie dazu, sich ganz andere Interessierte an diesen Vorhersagetechniken vorzustellen: Wenn etwa ein Werbetreibender aus der bloßen Beobachtung des Facebook-Verhaltens mit hoher Wahrscheinlichkeit weiß, einen starken Tabaknutzer vor der Flinte zu haben, kann er die angebotene Werbung entsprechend ändern. Und beispielsweise zu wissen, wem man billigen Fusel anbieten kann, weil er zu krankhaftem Alkoholmissbrauch neigt, könnte so manchen Anbieter auch interessieren – wenn er die ethischen Bedenken ignoriert. Angesichts der hohen Quote an Menschen, denen wegen Betäubungsmittelvergehen hinterhergestiegen wird, ist vielleicht auch die Identifizierung von potentiellen Straftätern ein Feld für staatliche Bedarfsträger oder für Geheimdienste und ihre Kompromatkoffer.

Ein Gedanke zu „Algorithmus erkennt euer Konsumverhalten anhand von Facebook-Daten

  • 31. Mai 2017 um 16:43
    Permalink

    Toller und vor allem wissenwerer Beitrag 😉
    Weiter so…

    Lieben Gruß
    Timo mit Hut
    DYNANiK

    Antwort

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*