Big Data Mood Bild
Big Data Mood Bild
Big Data Mood Bild
Big Data Mood Bild
Big Data Mood Bild

2019-04-04 8 Minuten

Fun Fact: Google besitzt dich

Eigentlich gar nicht so funny, dieser fact.

Kann man sagen was man will, dank der DSGVO haben wir zumindest eine erhöhte Anzahl von “ich hab mir meine Daten heruntergeladen, ihr ahnt NIE was dann passiert ist”-Artikeln.

Auch ich habe meine Chrome-Browserhistory bereits analysiert. In diesem Blogpost habe ich auch angekündigt, mal meine Location Historie zu analysieren.

Das einzige Problem: Google hat zu wenig Location Daten über mich.

Warum? Weil ich iPhone-User bin.

Ich hab es immer wieder einmal gelesen, wie krass der Unterschied zwischen Android und iOS Devices denn wirklich sein soll, was die Userdaten angeht. Apple setzt bekanntlich seit Längerem schon auf die Privatsphäre als Verkaufsargument.

Eine wirkliche Studie zu dem Thema hat mir bisher gefehlt.

Bisher.

Professor Douglas C. Schmidt von der Vanderbilt University hat im August 2018 eine Studie veröffentlicht, in der endlich mal genau getrackt wurde, was denn wie auf welchem Device an Userdaten getrackt wird.

An dieser Stelle darf ich direkt auf meinen (noch nicht existenten) Blogartikel verweisen, der da lautet:

“Wie du Google aus deinem Leben entfernst”.

Die Methode

Gefunden habe ich diese Studie auf der Seite von Digital Content Next, eine Initiative von vielen großen Medien-Marken. Natürlich. Die laufen schon seit Jahren Sturm gegen Google, aus Angst ums eigene Geschäftsmodell.

Aber das ist das Geile an der Technologie:

Wenn sich ein Handy zu einem Server verbindet, dann kann man das objektiv messen. Und sich ansehen, welche Daten geschickt wurden. Die ganze Studie scheint mir daher ein

“Veröffentlichen wir’s weils zu unserem Narrativ passt”, und kein

“Machen wir eine Studie, die zu unserem Narrativ passt”

zu sein.

Die Studie kannst du dir hier (PDF-Link) herunterladen. Ich lade dich ein, sie dir selbst durchzulesen, da ich nicht einmal alle Punkte in einem Blogartikel unterbringe.

Allgemein teilt ‚Fessor Schmidt die Datensammlung in ein zwei Gruppen ein:

  • Aktive Datensammmlung (Aktionen, wo ein User direkt mit einem Google-Produkt interagiert)
  • Passive Datensammlung (Dinge, die laufend getrackt werden, z.B. Location)

Diese beiden Gruppen gestreut über alle Google Produkte zeichnen ein ziemlich furchteinflößendes Bild, wie wir noch sehen werden. Insbesondere wurden in der Studie betrachtet:

  • Android
  • Chrome
  • Google Analytics und Co.
  • Das Display-Netzwerk (Doubleclick)

Ein neuer Google-User wird geboren

Am Besten kann man die Situation anhand eines Beispiels illustrieren:

Eric hat sich jahrelang gegen ein Smartphone geweigert. Seine Kinder haben ihn dann doch überredet. Er gönnt sich ein modernes Android-Handy. Als erstes wird er gefragt, ob er denn einen Google-Account hat.

Hat er nicht, wird also direkt mal erstellt. Wenn sich Eric Apps aus dem App-Store herunterladen will, kommen auch noch die Kreditkartendaten dazu.

So weit, so standard. Einen Google-Account hat heute wirklich schon fast jeder. Damit wird der Grundstein aller Datensammlung seitens Google gelegt:

Alles, was getrackt wird, wird irgendwie diesem Google Account zugeordnet werden.

Alles.

Weil Eric einer dieser Personen ist, deren Handy aber generell eigentlich nur herumliegt, kommen da nicht viele Daten zusammen.

Oder?

Doch:

Datensammlung bei nicht aktivem Smartphone

Während das Android-Handy nur herumliegt und nicht verwendet wird, telefoniert es 40 Mal zu Google.

Ich wiederhole:

Während das Android-Handy nur herumliegt und nicht verwendet wird, telefoniert es 40 Mal zu Google.

35 % dieser Requests sind der aktuelle Aufenthaltsort des Handys. Ein still liegendes und nicht verwendetes Android-Handy sendet also rund 14 Mal die eigene Location.

Im Vergleich: das iPhone ohne Google Produkte öffnet 5 Verbindungen zu Apple. Davon sind 1 % Location-Daten.

In Dateigrößen:

  • Google sendet 4,4 Megabytes (~130 pro Monat) an Userdaten pro Tag an sich selbst.
  • Apple dagegen 0,63 Megabytes

Damit du die Dateigrößen besser einschätzen kannst: meine Browserhistorie damals hatte 125.000 Datensätze auf 54 Megabytes.

Während du diesen Artikel liest, hat dein Google Handy (sollte es denn gerade still neben dir liegen) bereits 1 mal deine Location an Google gesendet.

Aus der Grafik oben ist auch ersichtlich, warum mein “Ich hab meine Location-Daten analysiert”-Blogartikel nichts geworden ist:

Besitzt Google nicht das Handy, mit dem ich unterwegs bin, kommt es nicht an meinen Aufenthaltsort.

Das zeigt, wie wichtig Android für Google ist: mit dem Betriebssystem steht der passiven Datensammlung nichts mehr im Weg. Auch kann man so direkt Google als Standardsuche einbringen und Chrome als Standardbrowser den Usern “aufzwingen”.

Aktive Handynutzung

Sein Handy wächst Eric inzwischen ans Herz: Es ist doch ganz praktisch. Eric ubert inzwischen durch die Stadt, surft wie ein Wilder und sieht sich Abends (ein wenig zu lange) Youtube-Videos seiner Lieblings-Comedians an.

Auch schlechte Memes werden liebend gerne an Arbeitskollegen per E-Mail verschickt. Shame on you, Eric.

Hier läuft Google zur Höchstform auf. Jede aktive Verwendung eines Google Dienstes wird protokolliert.

Das erschreckt jetzt vielleicht niemanden, aber wenn man sich ansieht, wie omnipräsent die Google-Dienste in unser aller Leben schon sind, wird es dann doch erschreckend.

Diese Information kann sich entweder mit Google Takeout beschafft werden, oder unter My Activity angesehen.

Im Beispiel oben sind das die Dienste

  • Youtube-Verlauf
  • Gmail (Google liest die E-Mails!)
  • Google-Suche
  • Chrome-Historie

Zwei dieser Dienste halten im Moment ein quasi-Monopol. Da kommt kein User drum herum.

Aber warum ist Uber im Beispiel oben erwähnt?

Uber gehört nicht zu Google. Aber die Plattform, auf der Uber aufgerufen wird. Es kann (und wird) also protokolliert werden, welche Apps wann aufgerufen werden. Und dies lässt sich wieder leicht mit anderen Daten verknüpfen. Man sehe sich nur folgende Sequenz an:

  • Eric öffnet Tinder, und schließt es nach 23 Minuten
  • Eric öffnet Uber
  • Die Location von Eric ändert sich nun: mit einer Durchschnittsgeschwindigkeit von ca. 30 km/h fährt er zu einer Location, an der er vorher noch nie unterwegs war.
  • Spät Nachts öffnet er erneut Uber. Eric fährt nach Hause.

Keine der verwendeten Apps gehört Google, die Story ist aber relativ eindeutig. Referenziert man das nun mit der Historie einer anderen Person, die sich zur selben Zeit am selben Ort aufhält (Aus den Sensordaten lässt sich sogar die Elevation, also die aktuelle Höhe über dem Meeresspiegel herausfinden. Es könnte also theoretisch herausgefunden werden, wer im selben Raum ist), hat Google die gesamte Geschichte.

Gut, das Szenario mit dem Cross-referencing ist fiktiv, aber technisch möglich. Ich weiß nicht, ob Google das macht (Uber hat auf jeden Fall schon mal One-Night-Stands getrackt), aber dass ein Datenpunkt namens sexually_active auf true, seldomly oder only_when_alone(Google kennt deine Browser-Historie!) gesetzt wird, würde mich nicht überraschen.

Ein Leben ohne Google?

Eric ist nun auf das iPhone XSRMAX seines Neffen umgestiegen. Er verwendet trotzdem noch Chrome und Gmail (wechseln wäre ja extrem aufwändig), geht aber ein wenig bewusster mit seinen Daten um.

Google kann ihm jetzt kaum mehr was anhängen oder?

Falsch!

Auch bei aktiver Vermeidung von Google-Diensten, aber aktiver Verwendung des Smartphones (in dieser Studie auf Basis von Nutzerstudien angenähert) ist Google omnipräsent.

Jede Webseite, auf der Werbung über Google Ads oder Doubleclick ausgespielt wird, sammelt Nutzerdaten.

Aber es muss nicht einmal Werbung auf der Seite laufen:

Jede Webseite, auf der Google Analytics und Co laufen, sammelt Nutzerdaten.

(no shit, dafür ist das Ding da)

Das wirklich brisante ist jedoch: während Google Analytics nur auf der Webseite, wo es installiert ist trackt (=das Cookie gilt nur für die jeweilige Webseite), ist es bei Doubleclick ganz anders.

Eric surft auf eine Rezept-Seite und kriegt eine Werbung von Google Netzwerk ausgespielt. Eine Werbung für ein Dating-Portal (wir erinnern uns, Eric scheint aktiv am Dating-Markt teilzunehmen). Im selben Atemzug wird ein Cookie nicht für die Rezeptseite, sondern für doubleclick.net gesetzt.

Jede andere Seite, auf der ebenfalls Doubleclick eingebunden ist, kann nun das Cookie auslesen, und so ein Userprofil basteln.

Am Beispiel von Eric weiß Doubleclick (ein Google-Subunternehmen) nun, dass er auf einer Rezeptseite unterwegs war, und sich 10 Minuten später über Veganismus informiert hat.

Zuordnung “anonymer” Daten

ABER MOMENT!

wirst du nun rufen. Wie kann Eric eine Werbung für ein Dating-Portal kriegen, wenn diese Information nur in seinem Google Profil gespeichert ist!? Da müsste doch irgendwo eine Zuordnung “anonymer” Cookie-Infos zu den persönlichen Daten im Google-Account stattgefunden haben?

Ja, die hat stattgefunden.

Ja, das steht in den AGB überall drin.

Nötig für so eine Zuordnung sind nur drei Schritte:

  • ein Doubleclick Cookie mit einer User-ID (Beispiel 31337) wird gesetzt
  • Es wird irgendein Dienst von Google verwendet, für den ein Google-Account notwendig ist (alternativ: der Google-Account ist direkt im Browser eingeloggt, dann ists noch einfacher)
  • Die Zuordnung der bisher anonymen User-ID 31337 ist nun möglich.

Fazit

Ich habe noch nicht einmal angefangen, Dienste wie

  • Google Photos
  • Google Pay
  • Chromecast
  • AMP (Accelerated Mobile Pages)
  • Google Home
  • Google Assistant
  • Google DNS
  • Google Fiber
  • Google Cloud

zu betrachten, und dieser Blogartikel ist schon ewig lang. Es ist schon eindrucksvoll, schwarz auf weiß den Unterschied wirklich zu sehen.

Das heißt natürlich nicht, dass Apple, Facebook und Co. Heilige sind. Aber zumindest Apple baut seine Technologie eher Privatsphären-fokussiert auf. Na klar, Werbung ist nicht das Geschäftsmodell in dem Fall.

Es scheinen sich aber ein paar Dinge immer wieder zu bestätigen:

Man kann fast froh sein, dass Google’s Motto lautet:

Don’t be evil

Oh, Moment.

Das Motto wurde inzwischen angepasst.

Shit.

Zeit, Google aus deinem Leben zu entfernen.

Von Hackern, Wordpress, SEO & Co

  • Wo kommt mein Spam her?
  • Wie leicht ist es, eine Wordpress Seite zu hacken?
  • Wie Umzugsfirmen ihre Gaunereien mit SEO umsetzen

...wöchentlich in deiner Inbox! 🚀

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.