2019-11-29 5 Minuten

Recap: We are Developers, Tag 2

We are Developers AI Kongress, Tag 2: Von Data Breaches bis Forensik

Ich stehe gerade in der Lobby der Hofburg und reflektiere ein wenig über den heutigen Tag. Und darüber, wie sehr ich die IT eigentlich liebe. Eine Branche, in der man die Zukunft verändern kann, und an der aber leider immer noch so wenige Menschen Interesse haben.

Aber ich will hier nicht über den Fachkräftemangel reden, sondern Insights bieten. Legen wir los.

Internet of Things in einer Autofabrik (ohne künstliche Intelligenz)

Eine Metallpresse in einer vernetzten Fabrik generiert pro Tag 1 Terabyte an Daten. Das sind 1024 Gigabyte, oder 400 Fussballfelder. Viel auf jeden Fall.

Bei so einer Datenmenge stoßen Datenbanken schnell an ihre Grenzen. Deshalb erklärt uns Nils Heuer, wie sie das bei Amazon machen. Er ist für den Bereich Automotive zuständig, und schafft es irgendwie, die riesigen Datenmengen in einer Autofabrik unter einen Hut zu bringen.

Eines fällt mir immer wieder auf in letzter Zeit: Dinge, die wir früher als “wtf” abgetan haben, sind nun wieder voll im Trend.

Wer hätte gedacht, dass es sinnvoll sein kann, alle Daten eines Internet of Things Gerätes einfach als formlose CSV irgendwo hochzuladen, und erst später sich um die Darstellung und Auswertung zu kümmern?

In der HTL hätte ich dafür verwirrte Blicke und einen 5er kassiert.

Aber irgendwie hat Nils auch recht: Andere Datenbankparadigmen stoßen hier an die Grenzen. Entweder muss man vorher genau wissen, wie wir die Daten verwenden (unrealistisch, Anforderungen werden sich ändern), oder haben sehr großen Aufwand und sind unflexibel.

Dennoch: Ich habe schon viele Projekte abgewickelt, in denen ich mit CSV Files herumgewurschtelt habe. Wie man das in einer Autofabrik umsetzt, das würde ich gerne mal in Echt sehen.

Wo Machine Learning heute schon hilft, Geld zu sparen

Von der Sammlung absurder Mengen an Daten direkt zur Verwendung eben dieser. Dr. Olivia Lewis zeigte in ihrem Talk die Situationen, in denen Machine Learning heute schon Kosten spart und Prozesse effizienter macht.

Zum Beispiel beim Thema Predictive Maintenance. Also der Vorhersage von Reparaturen. Hier sehen wir Sensordaten eines Plastikherstellers:

Links eine funktionierende Maschine, rechts die Maschine kurz vor einer Reparatur. Jetzt könnte man natürlich ein paar Menschen abstellen, die tagtäglich diese Daten ansehen und analysieren. Interessiert aber niemanden.

Deshalb: Machine Learning drüber und gut is.

Zum richtigen Kostenfaktor wird das bei einem Offshore Windpark. Auf Basis der Geräusche, die das Kugellager eines Windrades macht, kann man Probleme bis zu 3 Monate im Vorhinein “voraussagen”.

Das ist viel Zeit, wenn man bedenkt, dass für jede Reparatur ein Schiff mit einem Kran ausrücken muss. Ich will gar nicht wissen (oder eigentlich schon) wie viele Millionen gespart werden können, wenn das Schiff nicht immer einzeln ausrücken muss, sondern 3 Monate im Voraus eine Route geplant werden kann.

100 Tonnen Stracciatella Mousse

Als ich frisch gebackener Unternehmer war, hab ich mir sofort die METRO Karte geholt. Nicht weil es in irgendeiner Weise sinnvoll für mich ist, sondern einfach weil.

Da werde ich natürlich aufmerksam, wenn jemand bei der METRO aus Versehen 99.999 Packungen Stracciatella Mousse bestellt. Die Herren aus der METRO IT haben’s vorgerechnet. Im olympischen Schwimmbecken würde das Stracciatelle Mousse 1,44m hoch stehen.

Aber wer würde denn 100 Tonnen Mousse bestellen? Und vor Allem: Wie so eine Anomalie erkennen, wenn diese hohen Zahlen pro Auftrag für das Unternehmen eigentlich normal sind?

Im Endeffekt ist das ein knallhartes Business Intelligence Thema: Wer hat Einblick in die Daten? Und wie kann man diese Anomalie erkennen? Vorgestellt wurde dann Grafana, der feuchte Traum eines jeden Dashboard-geilen Managers.

Ich werd’s auf jeden Fall mal mit ein paar Kunden ausprobieren.

Wie man mit Clash of Clans Geldwäsche betreibt (Nein, ich meine hier nicht HC Strache)

Bisher waren die Talks eher fokussiert auf das Programmieren selbst. Das “Machine Learning angreifen” von Tag 1 war securityfokussiert.

Das ändert sich jetzt. Der Threathunter (was für eine geile Job Description) Bob Diachenko spricht darüber, wie viele Datenbanken und Services Unternehmen weltweit eigentlich komplett ohne Passwort öffentlich laufen haben.

Aber anstatt Policies aufzulisten (ProTip: so schafft man keine Compliance), dreht er den Spieß um:

Er hat nämlich auch öffentliche Datenbanken von Spammern und Geldwäschern gefunden.

Sind ja auch nur Menschen.

Besonders geil finde ich die Geldwäsche mit Clash of Clans:

Personen geben ihre Apple ID her, um ihre Clash of Clans Account voll mit Ingame-Währung aufzuladen. Natürlich zu einem Spottpreis, im vergleich zum offiziellen Shop. Die Kriminellen schaffen es so, gestohlene Kreditkarten zu waschen.

DAS ist Kreativität. Love it.

Wie unsere Datenmengen Forensiker überfordern

Werden in einem Kriminalfall Handys und Rechner sichergestellt (HC Strache lässt schon wieder grüßen), müssen diese irgendwie auf verdächtige Inhalte untersucht werden.

Aber dank (?) dem extremen Anstieg an Daten, die inzwischen von jedem von uns produziert werden, ist das gar nicht mehr so leicht. Kurz: Die entsprechenden Abteilungen gehen unter in der Datenmenge.

Inzwischen errätst du es wahrscheinlich: Künstliche Intelligenz kommt zur Hilfe. David Weichselbaum von T3K Forensics zeigt, wie sie hier unterstützen können.

Im Prinzip geht es um Bild- und Texterkennung und -Klassifizierung:

Wenn man durch Machine Learning riesige Datenmengen an Beweisen kategorisieren kann, werden aus Wochen gut und gerne Tage, bis das entsprechende Material gesichtet ist.

Noch brisanter wird dies beim Thema Kinderpornografie. Je weniger Ermittler sich mit dem Material beschäftigen müssen, um so besser aus meiner Sicht.

Ein hochinteressantes Gebiet, wo ich aber insgesamt froh bin, dass ich nichts damit zu tun zu habe. Aber gut, dass es Menschen wie David gibt. Und AIs, die diesen Job in Zukunft übernehmen.

Fazit, Tag 2

Nach 2 Tagen Event bin ich immer ziemlich fertig. Heute wurde noch einmal ein wenig mehr Gas gegeben. Sehr hohe Qualität der Talks, sehr hoher Frauenanteil bei den Speakern, feine Sache.

Bis zum nächsten Jahr!

Von Hackern, Wordpress, SEO & Co

  • Wo kommt mein Spam her?
  • Wie leicht ist es, eine Wordpress Seite zu hacken?
  • Wie Umzugsfirmen ihre Gaunereien mit SEO umsetzen

...wöchentlich in deiner Inbox! 🚀

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.