Data Driven Business 2018 in Berlin
Am 13.-14.11. fand die Data Driven Business Konferenz in Berlin statt. Auf dieser Konferenz waren drei Themen im Fokus: Digital Growth für Conversion Optimierer, die digitale Marketing Evolution für Marketer im allgemeinen sowie Predictive Analytics für Analysten, Data Scientists und Mathematiker. Unter den insgesamt rund 600 Teilnehmern waren auch zwei Vertreter von MASSIVE ART vor Ort. Elena Kojic hat sich insbesondere die Marketing Evolution Tracks angehört, ich hab mir insbesondere die Predictive Analytics Tracks angehört.
Warum haben wir uns für diese Konferenz entschieden?
MASSIVE ART ist der digitale Dienstleister für Kommunikation in West-Österreich. In diesem Zusammenhang spielt der gezielte Einsatz von Daten eine enorm wichtige Rolle. Hier ist es unser Ziel, cutting-edge Lösungen für und mit unseren Kunden zu entwickeln und zu betreiben. Um hier nicht nur im eigenen Brei zu schwimmen, sondern auch von anderen Best-Practices zu profitieren, war diese Konferenz der ideale Platz: Es gab überraschend viele Use Cases (etwa Miles&More, Lidl, ProSieben, HP, Deutsche Bahn, Scout24, DeinHandy, Heycar, uvam), die Learnings und Ihre Erfahrungen geschildert haben:
- Welche Voraussetzungen gibt es, damit Big Data Projekte erfolgreich umgesetzt werden
- Was ist für gute und erkenntnisreiche Analyse wichtig
- Was sind die technischen Best-Practices
- Welche Anwendungsfälle von AI gibt es in diesen Unternehmen heute
- Welche Hürden sind organisatorisch zu überwinden, um die digitale Transformation voranzubringen.
Ganz allgemein gesprochen, war für mich auf dieser Konferenz besonders auffällig:
- Die Predictive Analytics Tracks waren gefühlt doppelt so gut besucht wie die Marketing Tracks. Hier waren deutlich mehr Leute im Publikum.
- Die Mann-Frau-Verteilung unter den Besuchern erschien mir überraschend ausgeglichen zu sein – insbesondere unter den Data Scientists.
- Trotzdem gab es überwiegend männliche Speaker (wer ist hier das redselige Geschlecht?! ;-) )
- Die Konferenz war ein guter Platz für Networking. Ich hab dort nicht nur viele alte Bekannte getroffen, die ich über die Jahre in den verschiedenen Stationen so kennen gelernt hatte, sondern auch viele neue interessante Begegnungen gehabt.
Die Erkenntnisse aus zwei Tagen in einem Blog zusammenzufassen ist natürlich kaum möglich, aber gerne will ich versuchen, die Key-Take-Aways für mich deutlich zu machen.
Big Data in Baby Shoes
Themen wie Maschine Learning und Big Data kursieren ja nun schon seit Jahren. Die großen Digitalisten wie Google, Amazon und Facebook leben vor, wie Daten zum Öl werden, das die Zahnräder schmiert. Digitalisten wissen, wie man dieses Öl raffiniert, um die bestmöglichen Anwendungen für seine Kunden zu realisieren. Allerdings scheinen auch in Deutschland große Unternehmen wie Lidl, Miles&More oder Vodafone die Nutzung von Daten zur automatisierten Entscheidungsfindung erst seit etwa drei Jahren wirklich anzugehen. Norbert Wirth (PWC) hatte dafür folgende Gründe:
- Die traditionellen Unternehmen entscheiden in der Regel intuitiv, halten Ihre Daten in Silos und arbeiten insbesondere kostenorientiert.
- Die modernen Unternehmen hingegen, arbeiten mehrwertorientiert und leben eine Datenkultur, die es möglich macht, Entscheidungen auf Basis von Daten zu treffen
Abteilungsgröße
Interessant fand ich, dass diese Unternehmen noch vor drei Jahren nur eine kleine Abteilung mit zwei bis drei Data Scientists hatten, und diese Abteilungen nun auf ca. zwanzig Mitarbeiter gewachsen sind – bestehend aus Data Scientists, Developer und Product Ownern, die die Teilprojekte business-verantwortlich weiterführen.
Erfolgskriterien für Predictive Analytics Lösungen
- POC (Proof of Concept): Viele Unternehmen schaffen es einen (oder mehrere) POCs umzusehen, schaffen es aber nicht, diese Big Data Projekte aus dem POC Stadium hinaus zu entwickeln. Entscheidend ist, dass vorher klar definiert ist, wann der POC erfolgreich war und welchen Nutzen er bringen soll. Das Dream Team für einen POC besteht nicht nur aus einem Data Scientist und Developer, es sollte auch ein UX-Expert und Product Owner dabei sein. Und wie in jedem anderen Projekt ist es auch hier wichtig, dass nicht ein halbes Jahr lang im stillen Kämmerlein gewerkelt wird, sondern dass jeder Sprint eine neue Teilfunktion liefert, die sichtbar und erlebbar wird.
- Datenkultur etablieren: eine Datenkultur kann nur gelebt werden, wenn sie vom CEO vorgelebt wird UND wenn alle wissen, wer welche Hol- und Bring-Schuld hat. Scout24 hat deshalb ein sogenanntes „Data Landscape Manifesto“ als Basis geschaffen, an dem sich jeder orientieren kann.
- Transparenz: Wie muss eine Data-Driven-Decision-Engine im Unternehmen enstehen? Das Learning aus diversen Use Cases ist, dass dies nicht als Inselprojekt parallel zum laufenden Betrieb entwickelt werden darf. In diesem Fall ist die Gefahr zu groß, dass die Akzeptanz der Abteilungen fehl. Die Empfehlung ist, dass diese Decision-Engine von Anfang an transparent gebaut werden muss, indem die Stakeholder aus den betreffenden Abteilungen mit an den Tisch genommen werden – von der Konzeption über die Entwicklung bis hin zur Optimierung / zum Betrieb. Bei Miles&More hat man das verpasst und ein System geschaffen, das Entscheidungen übernimmt, die vorher Personen übernommen haben. Diesem neuen System wird aber nicht vertraut. Es wird als Blackbox wahrgenommen. Da dieses System aber die Arbeit anderer Stakeholder beeinflussen wird, muss dies integrativ entwickelt werden. Eine kontinuierliche und transparente Kommunikation ist ein entscheidender Erfolgsfaktor.
- Einfachheit & Steuerbarkeit: Der Service muss sehr einfach anwendbar sein, damit es breitflächig in der Organisation verwendet wird. Am besten mit nur einem Knopfdruck. Gleichzeitig ist es essentiell, das System aussteuern zu können. Dazu muss man die verwendeten Methoden sehr gut kennen und wissen, an welchen Parametern wie geschraubt werden kann, um das Ergebnis zu beeinflussen.
Und da es eine sehr technische Konferenz war, mit Vorträgen über Algorithmen, Formeln, Systemen, Grundsatzdiskussionen über R vs. Python, hier noch ein paar technische aber trotzdem gut verdauliche Weisheiten:
Garbage In – Garbage Out
Das Datensystem kann natürlich nur wertvolles ausspucken, wenn die Daten, die hineingegebenen werden eine gewisse Qualität haben. Man muss sich also sozusagen die „Hände“ schmutzig machen und in diese „ölige braune Sosse“ hineingreifen und dafür sorgen, dass die Daten konsistent, vollständig und sinnvoll sind sowie sinnhaft miteinander verbunden werden können. Das wiederum geht nur, wenn man sich darüber im klaren ist, WAS man eigentlich herausfinden will.
Methoden & Methoden-Wissen
Einer der Gründe, warum ich auf diese doch sehr technische Konferenz gegangen bin ist, weil ich wissen wollte, welche Algorithmen die denn so verwenden. Was ist der heißeste Scheiß. Der am häufigsten genannte Algorithmus war Random Forest. Auch darüber hinaus werden wohl überwiegend Klassiker der Statistik verwendet, also Regressions-Modelle, K-Means, oder Decision Trees. In Ausnahmen wurden auch mal andere ungewöhnlichere Algorithmen genannt wie RBM, SOM oder PCA.
Visualisierung
Und zu guter letzt noch eine sehr wichtige Erkenntnis: Die Visualisierung von Daten ist ein extrem hohes Gut. Aber der wichtigste Teil der Visualisierung ist, dass die Visualisierung „dynamisch“ ist. Das heißt, dass man mit der Visualisierung arbeiten kann. Man muss Datenpunkte anfassen und so die Daten auch filtern können. So kann man sehr schnell Ausreißer erkennen und neue Erkentnisse gewinnen.
DSGVO
Ich habe mir auf dieser Konferenz vor allem Use Cases von anderen Unternehmen angeschaut. In der Frage-Runde kam immer wieder auf: Inwieweit hat die DSGVO im Projekt eine Rolle gespielt. Interessanterweise haben eigentlich alle Vertreter die gleiche Aussage getroffen: Natürlich hatten wir ein DSGVO Projekt im Unternehmen, aber wir haben die Daten schon immer korrekt erfasst, haben schon immer kommuniziert und hatten deshalb keine Einbussen.
Würde ich die Konferenz empfehlen? Ja durchaus. Hast du sonst noch Fragen zu „analytics driven decision making“, dann komme gerne auf mich zu.