2018-04-26 5 Minuten

Ich habe 125.814 Datensätze über mich analysiert.

Durch mein Surfverhalten liefere ich Google 344 Datensätze pro Tag.

Auch wenn mir die DSGVO in Österreich ein wenig Wind aus meinen Security-Bestrebungen nimmt (4% vom Umsatz als Strafe wären ein gutes Verkaufsargument gewesen), ist das Thema Daten noch lange nicht gegessen.

Apropos Essen.

Auf takeout.google.com (see what i did there?) kann man sich die Daten herunterladen, die Google über einen hat.

Das hab ich gemacht. Beim 3. Versuch hat es dann auch geklappt.

Vorhang auf für die Reihe: “Holy shit wie viele Daten haben die eigentlich über mich”.

Akt 1: meine Browser History.

Wer Chrome verwendet, wird getrackt.

Das ist jetzt kein Geheimnis, sollte man sich aber trotzdem vor Augen führen.

Das war auch mit ein Grund, warum ich jetzt wieder am Firefox unterwegs bin:

wenn schon alle Daten gesammelt werden, dann teile ich die wenigstens auf so viele Player wie möglich auf, damit jeder nur einen kleinen Teil meines Lebens besitzt.

Aber legen wir los.

Der Download meiner Browserhistory ist eine 54 Megabyte Datei. Das klingt jetzt nicht viel, aber für eine reine Textdatei ziemlich groß. Das Ganze habe ich in mühsamer Kleinarbeit in eine Datenbank geladen, und habe jetzt mein Online-Leben zur freien Verfügung.

Hier mal ein Überblick:

Hier direkt mal die erste Frage: Warum nur 1 Jahr?

Hier konnte ich auf Google weder finden ob die Daten dann gelöscht werden, oder ob sie mir nur Zugriff auf 1 Jahr gewähren.

Hier tauchen schon mal die ersten Learnings auf:

  • Die Daten herunterzuladen ist viel aufwändiger als von Google kommuniziert. Ich hatte 3 “fehlgeschlagene” Versuche, bis ich zu meinen Daten kam
  • 125.000 Datensätze in einem Jahr sind sch*** viel.
  • Google differenziert auch zwischen Arten, wie die Webseite aufgerufen wurde.

Ich weiß  jetzt noch nicht, wohin die Reise führt, aber beginnen wir einfach mal.

Arten der Webseitenbesuche

Hier gibt es ein paar unterschiedliche Ausprägungen:

  • Über einen Link auf die Seite gekommen
  • Eingetippt
  • Nach einem Formular auf eine Seite redirected worden
  • Eine Seite aktualisiert
  • Und noch ein paar andere, von denen ich nicht weiß, was sie bedeuten.

So sieht das Ganze dann aus:


71.000 mal bin ich über einen Link auf eine Webseite gekommen. Keinen Plan ob das gut(?) ist.
Das letzte Jahr sieht für mich also so aus:

Die meistbesuchten Webseiten

Jetzt wird es interessant. Was bin ich für ein Mensch?

Hier habe ich mir nur die Domain selbst rausgesucht, und nach der dann sortiert. In meinen Webseitenbesuchen waren auch hunderte Domains dabei, die ich nur zum Programmieren verwende, und die es nur lokal auf meinem Rechner gibt. Diese sind hier gefiltert.

Aber schauen wir uns das an:

Ich hätte mir nicht gedacht, dass ich so viel auf Reddit unterwegs bin. Das sind 5% meines gesamten Online-Lebens. Woah.

Der Rest jedoch war zu erwarten. Pocket ist mein Readinglist-Tool, Producteev mein Taskmanagement fürs Unternehmen und Toggl mein Timetracking.

Als Nächstes will ich wissen, was mein durchschnittlicher Tag ist. Dazu muss ich alle Seiten rausfiltern, die durch eine Verlinkung entstanden sind (ansonsten haben wir für 1 Facebook Session viele Aufrufe in den Daten).

Ein durchschnittlicher Tag des Martin H. sieht so aus:

  • ich gehe 13 mal auf Google
  • lasse mich 10 mal von Reddit ablenken
  • bin 5,2 mal auf Facebook
  • 3,2 mal checke ich meine nächsten Tasks

Fun Fact für meine Programmiererkollegen: Mein Stackoverflow-Pageviews-pro-Tag-Score liegt bei 2,4. Ich glaube das ist gut ????

Sind Programmierer wirklich nachtaktiv?

Zu jedem Seitenaufruf speichert Google die genaue Zeit und das Datum. So kann ich meinen Tagesrhythmus anhand meiner Browserhistorie ausfindig machen:

Haha jetzt wird es aussagekräftig. Meine Tage beginnen spät, und sind surftechnisch intensiv. Der Peak ist von 16 bis 17 Uhr mit durchschnittlich 32 Seitenaufrufen pro Stunde.

Das ist jetzt natürlich ein Überblick über alle Webseiten, da können wir noch einen Schritt in die Tiefe gehen:

Das Rezept für meine Morgenroutine ist also 3 Seiten Reddit, 1,5 Seiten Facebook und 0,9 Seiten Youtube – garniert mit 0,01 Googles pro Stunde.

Surfverhalten übers Jahr

Tatsächlich, im Sommer bin ich ein bisserl weniger vorm PC. Nur 400 Seitenaufrufe pro Tag. ????

Hier auch gut zu erkennen:

Der Moment wo ich auf Firefox gewechselt bin. Und wenn ich mir die Daten anschaue, die Google über mich hat:

zurecht!

Fazit

Bei der ganzen Diskussion um Facebook und Cambridge Analyca hat sich Google dezent zurückgehalten.

Was aber natürlich nicht heißt, dass Google unser Leben nicht unter Kontrolle hat.

Alleine durch mein normales Surfen liefere ich Google über 344 Datensätze pro Tag. Dabei habe ich noch nicht einmal angefangen, meine Location Historie zu analysieren. Oder die Daten mit anderen Tools von Google wie Gmail, Google Maps oder den Kalender verknüpft.

Aber jetzt brauche ich dich: Was soll ich als Nächstes untersuchen? Wie findest du diese Art von Artikeln? Kommentiere unten ⬇️

Von Hackern, Wordpress, SEO & Co

  • Wo kommt mein Spam her?
  • Wie leicht ist es, eine Wordpress Seite zu hacken?
  • Wie Umzugsfirmen ihre Gaunereien mit SEO umsetzen

...wöchentlich in deiner Inbox! 🚀

2 Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.