Machine Learning & E-Commerce – ein Interview mit Patricia Kaufmann

Das erwartet euch in diesem Artikel

  • Was können Open Source Programme zur Datenanalyse?
  • Werden wir alle durch Maschinen ersetzt?
  • Was kann Machine Learning im E-Commerce leisten?

Grafik: Interview mit Patricia Kaufmann

Hallo Patricia und vielen Dank, dass du dir Zeit für ein Gespräch genommen hast. Du sprichst ja bald beim E-Commerce Day zum Thema Machine Learning. Aber bevor wir zu diesem spannenden Feld kommen, stelle dich doch bitte einmal vor.

Hallo Oliver. Danke für das Interesse und die Chance dieses Interview mit dir zu führen. Gerne kann ich ein paar Worte zu mir sagen. Ich bin seit knapp zweieinhalb Jahren bei der SHI GmbH als Consultant im Bereich Search und Analytics tätig. Wir beschäftigen uns mit Suche in jeglicher Hinsicht – das ist zum einen die Suche in Online-Shops und zum anderen interne Suchen innerhalb von Unternehmen. Um hier mehr Insights zu bekommen, befassen wir uns außerdem mit der Analyse des Gesuchten, um noch mehr Wert für den Kunden und sein Unternehmen zu erzielen.

Das ist ja ein ganz schön weit gestecktes Feld. Gerade die interne Suche macht ja oft Probleme. Kannst du mir erzählen, wie ihr bei diesem Thema typischerweise vorgeht?

Als erstes muss ich betonen, dass es (leider) keine typische Vorgehensweise gibt. Die Suche und die Analyse von Daten ist immer stark abhängig von den Daten, die verwendet werden. Üblicherweise vereinbaren wir dazu erst einmal einen Termin, um herauszufinden, was die Use Cases sind und was der Kunde aus seinen Daten mehr oder auf andere Weise erfahren möchte, als er es im Moment kann. Für die Implementierung setzen wir fast ausschließlich auf Open Source Software, um Lizenzkosten zu vermeiden. Ein Beispiel könnte also sein “Ich möchte all meine Mitarbeiter-Daten mit den Verkäufen der letzten Monate zusammenbringen”. Daraufhin folgt unsererseits die Aufbereitung der Daten und die Verknüpfung. Das sei hier mal als Mini-Beispiel genannt. In der Realität sind die Anforderungen selbstverständlich sehr viel komplexer und die zugrundeliegenden Datenquellen umfangreicher.

Es ist ja ein spannender Ansatz, nur auf Open Source zu setzen. Gibt es auch Kunden, die das nicht möchten – oder bei denen es schlicht keine passende Lösung gibt? Oder programmiert ihr dann einfach selber eine?

Bisher hat sich kein Kunde beschwert, wenn er um zusätzliche Lizenzkosten herum kommt. Nein, Spaß beiseite. Es gibt natürlich Aufgaben und Anforderungen, die rein mit Open Source Tools nicht oder zumindest nicht ohne Anpassung lösbar sind. Da wir aber im Beratungsgeschäft tätig sind, ist es für uns kein Problem, wenn ein Kunde zusätzliche Produkte einsetzen möchte. Wir stellen dann sicher, dass die auf Open Source basierenden Komponenten mit den anderen Tools so zusammenspielen, dass der meiste Nutzen aus beiden Welten gezogen werden kann. Aber klar, gerne programmieren wir dann auch das nötige Gerüst um die Suchmaschine herum.

Und wenn das Gerüst steht, analysiert ihr auch die reinkommenden Daten für den Kunden? Wie muss ich mir hier den Umfang bzw. deine Hauptaufgaben vorstellen?

Die Hauptaufgabe besteht meist aus der Beschaffung der Daten und der Aufbereitung. Vielleicht kann ich das anhand eines Beispiels genauer beleuchten. Stell dir vor, der Kunde hat einen Online-Shop mit einer integrierten Suchfunktion. Es ist eine Sache, für die Nutzer des Shops passende Produkte zu präsentieren, aber eine völlig andere Sache, die Eingaben der Nutzer weiter zu verarbeiten. Eine Aufgabe könnte sein, dass anhand der selektierten Produkte herausgefunden werden soll, ob die Sortierung, also die Relevanz, der Ergebnisse gut ist. Die Aufgabe ist also in erster Linie, mitzuschreiben bzw. zu tracken, auf welche Produkte die Benutzer klicken, um dann im zweiten Schritt zu ermitteln, ob die Sortierung gut war. Wenn beispielsweise alle für die Suche nach “Turnschuh gelb” auf die zweite Seite navigieren müssen, bis sie etwas auswählen, sollte die Relevanzberechnung überdacht werden. Und am liebsten möchte man das natürlich nicht manuell machen, sondern diese Aufgabe dem System selbst überlassen – klassischerweise Machine Learning genannt.

Habt ihr denn für solche Dinge eure eigenen Algorithmen, die ihr auf solche Fragestellungen ansetzen könnt? Und wie schafft ihr es, dass die sich immer weiterentwickeln?

Unsere eigenen Algorithmen haben wir in dem Sinne nicht. Aber die verschiedenen Open Source Suchtechnologien, die wir einsetzen – namentlich Apache Solr oder Elasticsearch – haben beide gewisse Schnittstellen und Anbindungsmöglichkeiten für Modelle, die aus maschinellen Lernalgorithmen entstanden sind. So können wir diese für die Anzeige und Sortierung der Suchtreffer nutzen. Wie bei allen Anwendungen im Bereich Maschine Learning steht und fällt der Nutzen natürlich mit den zugrundeliegenden Modellen und vor allem dem Trainings-Datensatz. In dem Beispiel von oben könnten die aktuellen, neuen Daten (der letzten Tage) wieder verwendet werden, um die Modelle anzupassen oder neu zu trainieren. So kann auch auf Trends und ähnliches reagiert werden – im Sommer ist der gelbe Sportschuh vielleicht gefragter und im Winter der gelbe Sneaker mit gutem Futter.

Das hört sich nach viel Arbeit für euch und die Algorithmen an. Merkt ihr denn, dass sich das Machine Learning aktuell rasant entwickelt oder geht ihr das Ganze lieber langsam an und setzt erst einmal auf Technologien, die ihr schon kennt?

Eine rasante Entwicklung im Machine Learning ist im Moment vor allem bei dem Interesse an dem Thema zu spüren. Ich war letzte Woche auf einer Konferenz, bei der es allgemein um neue Entwicklungen im Bereich E-Commerce ging und der Trend zu Machine Learning war in den Vorträgen ganz klar zu erkennen. Wir würden uns natürlich freuen, das auch mehr einsetzen zu können. Aber im Moment setzen viele noch auf klassische Methoden, um diese Relevanz-Fragen zu lösen. Auch ohne Machine Learning kann man hier natürlich viel erreichen und gute Ergebnisse erzielen. Es sollte deshalb immer untersucht werden, inwieweit sich die Anbindung von Machine Learning Algorithmen oder in meinem Beispiel Learning to Rank Features für den Shop oder das Unternehmen lohnt.

Was denkst du denn, in welchen Bereichen das Machine Learning auf absehbare Zeit einen wirklichen Durchbruch haben wird?

Ich denke auf lange Sicht werden sich Machine Learning Algorithmen in nahezu allen Bereichen finden lassen. Das ist schlicht der Tatsache geschuldet, dass die Datenmengen immer größer werden und die Verarbeitung einfach durch den Menschen nicht mehr erfolgen kann. Ich sehe die ersten Durchbrüche in der Klassifizierung von Objekten – das können Produkte in Online-Shops sein oder E-Mails in einem Unternehmen oder aber auch Kunden- oder Mitarbeiterdaten.

Fraglos, und auch Google macht ja immer mehr damit. Habt ihr durch eure eigenen Erfahrungen einen Einblick, wie das Ganze bei Suchmaschinen funktioniert und wie man darauf optimieren kann? Bzw. fällt es euch dank eurer Arbeit leichter, zu verstehen, wie beispielsweise RankBrain funktioniert?

Ich glaube hier muss ich kurz etwas anfügen bzw. erklären, da du auf Google ansprichst. Wenn ich von Suchmaschinen spreche, meine ich damit nicht Suchmaschinen wie Google oder Yahoo oder ähnliches. Die Suchmaschinen, mit denen wir arbeiten, sind vielmehr die Suchtechnologien, die in (beispielsweise) Online-Shops eingebaut sind. Es geht also nicht darum, dass ein Google-Nutzer auf meinen Shop weitergeleitet wird und wie ich bei der Google-Suche besser bewertet werden kann, sondern darum, dass Nutzer meines Online-Shops die Suchfunktion im Shop verwenden und sinnvolle und passende Ergebnisse erhalten. Aber klar, durch unsere Arbeit in dem Bereich fällt es uns schon leichter, die verschiedenen Mechanismen und Algorithmen zu verstehen. Allerdings ist es so, dass Machine Learning häufig dann eingesetzt wird, wenn der Mensch eben nicht mehr verstehen kann, wie die Daten zusammenhängen. Das wären bei neuronalen Netzen beispielsweise die sogenannten Hidden Layer, also absichtlich versteckte Schichten, auf die wir als Mensch keinen Einfluss haben. Zur Optimierung dieser Algorithmen: Zukunftsvision ist, dass es nicht mehr nötig ist, in die Optimierung einzugreifen, sondern dass diese selbstlernenden Algorithmen und Systeme sich alles beibringen, was sie für die Optimierung wissen müssen. Aber bis dahin ist sicherlich eine Bewertung des Outputs dieser Algorithmen durch Menschenhand unabdingbar und auch notwendig.

Wenn die Menschenhand irgendwann gar nicht mehr eingreifen muss, kann es aber natürlich passieren wie vor kurzem bei Zalando, wo alle Marketer und Analysten gekündigt wurden. Kannst du dir vorstellen, dass unsere Zunft auf lange Sicht komplett durch Maschinen ersetzt wird? Oder gibt es Themen, die ein Mensch einfach besser abdecken kann?

Puh, das ist natürlich fast schon eine philosophische Frage. Ich persönlich glaube nicht, dass der Mensch vollständig durch Maschinen ersetzt werden kann. Ich denke, ein Blick in die Vergangenheit zeigt, dass der Mensch Teilaspekte und -aufgaben an Maschinen übergeben kann und sich damit nicht selbst aus dem Rennen nimmt, sondern sich dadurch die Zeit verschafft, an anderen Themen weiter zu arbeiten. Wenn es also künftig keine Datenanalysten mehr gibt oder geben muss, weil sie durch maschinelle Kollegen ersetzt wurden, dann werden sich andere Bereiche auftun, in denen die früheren Datenanalysten sich und die Welt weiterentwickeln können. Kurzum gibt es denke ich immer Aufgaben für den Menschen, die eine Maschine zu dem Zeitpunkt nicht zu lösen vermag – die Bereiche verschieben sich aber sicherlich durch den Einsatz von Machine Learning.

Das hört sich sinnvoll an. Aber wenn wir nochmal auf den E-Commerce zurückkommen: Was denkst du, welche “Handgriffe” sich hier in Zukunft am ehesten auf Maschinen übertragen lassen werden?

Ich denke, im Bereich E-Commerce lässt sich in einem Wort beantworten, wofür Machine Learning eingesetzt werden kann: Personalisierung. Dabei kann es darum gehen, dass jeder Nutzer durch Maschinen definierte personalisierte Kategorien präsentiert bekommt oder darum, dass dem einen Nutzer bei der Suche nach “Turnschuh gelb” der Sneaker mit den gelben Schnürsenkeln angeboten wird und der andere Nutzer mit der gleichen Anfragen den gelben Sportschuh sieht – in der passenden Größe, mit der passenden Versandvariante und der passenden, personalisierten Bezahlmöglichkeit. Auf diese Weise kann jeder individuelle Nutzer sein ganz persönliches Shopping-Erlebnis genießen und genau die Produkte finden, die er haben wollte oder haben wollen wird.

Das wird sicherlich spannend. Und wenn ihr mehr zu diesem Thema erfahren wollt, schaut euch Patricia auf dem E-Commerce Day an. Sie hält dort einen Vortrag zu genau diesem Thema! Hier könnt ihr bis zum 24.04. ein Ticket gewinnen.

Über den Autor

Oliver Engelbrecht

Chefredakteur
Nach meinem Studium der Politikwissenschaft (mit dem Schwerpunkt Diplomatie) habe ich zunächst das SEO-Portal aufgebaut und zuletzt als Chefredakteur geleitet. Nun bin ich bei der Agentur LEAP/ für das Marketing verantwortlich und koordiniere unser Magazin GrowthUp - wiederum als Chefredakteur.
Kommentare