About Ruth: Head of Data Science Onlineshop

real.digital meets code.talks

Data Science ist ein bedeutender Aspekt im E-Commerce, den auch real.digital zu schätzen weiß. Mithilfe unterschiedlicher Methoden aus dem Machine Learning und Data Mining wird der Marktplatz stetig verbessert und kundenfreundlicher gestaltet. Eines dieser Verfahren, nämlich die Nutzung künstlicher neuronaler Netze, wird derzeit stark gehypt – zu undifferenziert gehypt, findet unser Head of Data Science, Ruth Janning. 

Ruth wird auf der code.talks am 12. April einen Vortrag zum Thema „Data Science and Neural Networks – Big Love or just a Love Affair?“ halten. Wie die Chancen für das vermeintliche Traumpaar stehen und was genau ein Head of Data Science bei uns leistet, erfahrt ihr im folgenden Interview.

Hast du Lust darauf, spannende Herausforderungen bei real.digital zu meistern? Dann sieh dir unsere aktuellen Stellenausschreibungen an!

https://www.real-digital.de/karriere/unsere-stellenangebote/

Hallo Ruth! Du bist seit fast sechs Monaten Head of Data Science Onlineshop bei real.digital. Was genau kann ich mir darunter vorstellen und was macht man damit auf einem Marktplatz?

Im Bereich Data Science geht es darum, mittels Algorithmen automatisch Muster und Zusammenhänge in großen Datenmengen zu erkennen. Denn einerseits können Menschen allein die schiere Masse an Informationen nicht bewältigen und andererseits identifiziert die KI (= künstliche Intelligenz) auch Zusammenhänge, die diesen möglicherweise entgehen.

Dabei kommen verschiedene Verfahren aus dem Machine Learning und Data Mining zum Einsatz, durch die wir die gewünschten Informationen erhalten. Unser erstes Projekt hat beispielsweise die Varianten auf dem Marktplatz ermöglicht. Anstatt für jede Variante eines Produkts eine eigene Seite besuchen zu müssen, kann der Kunde nun auf einer einzigen Seite alle Ausprägungen erreichen, indem er zum Beispiel auf die gewünschte Größe oder Farbe eines Artikels klickt.

Um das zu gewährleisten, erstellten wir zunächst einen Workflow, mit dem wir die jeweilige Problemstellung, die verfügbaren Daten und mögliche Lösungen ausmachen konnten. Oft testen wir verschiedene Verfahren des Data-Minings, die wir entsprechend evaluieren, bevor wir uns endgültig für einen Ansatz entscheiden. Bei der Einführung der Varianten fiel unsere Wahl am Ende auf die Clusteranalyse als Methode. Mittels der Programmiersprache Python konnten wir so einen Service implementieren, der automatisch alle Produkte zusammenfasst, die in eine Gruppe gehören. Und indem das PHP-Entwicklerteam  auf diesen Service im Hintergrund zugriff, konnte es unseren Marktplatz entsprechend anpassen.

Das klingt spannend, aber unpersönlich. Betrachtest du dich selbst vor allem als Datenschubser und KI-Fan oder befasst du dich auch gerne mit Menschen?

Ja klar! Ich mag beides – mich interessierte der Bereich KI schon immer ungemein, aber ich liebe den Austausch mit anderen Menschen. Es macht mir wahnsinnig Spaß, gemeinsam mit meinem Team neue Lösungen zu entwickeln. Während meiner Promotion hielt ich Vorlesungen und arbeitete sehr eng mit den Studenten zusammen, die ich beispielsweise auch bei ihrer Abschlussarbeit betreute. Auf die menschliche Ebene möchte ich bei meinem Job, gerade in der Position als Teamlead, keinesfalls verzichten.

Dann freust du dich also auf deinen Vortrag bei der diesjährigen code.talks? Wie bist du auf das Thema gekommen und was kannst du uns jetzt schon darüber verraten?

Ja, absolut. Es ist außerdem das erste Mal, dass ich keinen rein wissenschaftlichen Vortrag halte, sondern auch einen gewissen Unterhaltungswert liefern will. Mein Thema entwickelte sich aus der praktischen Arbeit bei real.digital und den fachlichen Diskussionen mit anderen Personen aus dem Bereich der Data Science. Dabei fiel mir auf, wie häufig die neuronalen Netze zu Unrecht als Allheilmittel betrachtet werden. Zwar können sie eine hervorragende Methode des Data-Minings sein, allerdings nur, wenn die Ausgangslage stimmt. Beispielsweise müssen die Daten sehr gut verteilt und ihre Menge groß genug sein. Außerdem sollte ich mir darüber im Klaren sein, dass die Arbeit mit neuronalen Netzen dem Umgang mit einer Blackbox gleichkommt: Die Auswahl, die von der KI vollzogen wird, ist für mich nicht nachvollziehbar.

Daher sollte man vorab prüfen, ob andere, vielleicht sogar einfachere Modelle wie Entscheidungsbäume oder K-Nearest-Neighbors besser für die jeweilige Problemstellung geeignet sind.

Was hält die Zukunft für real.digital im Bereich Data Science bereit?

Eines unserer nächsten großen Projekte sollte die Optimierung der Recommendation Engine sein. Passende Empfehlungen können für Kunden sehr hilfreich sein, daher legen wir Wert darauf, ein ausgefeiltes System zu entwickeln. Grundsätzlich gibt es zwei verschiedene Ansätze: Entweder dient als Ausgangspunkt das Produkt, für das sinnvolle Ergänzungen oder ähnliche Alternativen angezeigt werden, oder der Kunde selbst. Dabei ist es natürlich wichtig, von Anfang an in engem Austausch mit den Datenschutzbeauftragten des Unternehmens zu stehen. Deswegen bin ich sehr froh, dass sich die Zusammenarbeit nicht nur in unserem Team, sondern auch mit anderen Abteilungen so einfach und angenehm gestaltet.

Alle Infos zur Veranstaltung 

 

Was: code.talks commerce special

Wann: 12. bis 13. April

Wo: Berlin (CineStar in der KulturBrauerei)

 

Ruths Vortrag „Data Science and Neural Networks – Big Love or just a Love Affair?“ findet am 12. April von 15:00 bis 15:45 Uhr in Kino 5 statt.

 

Hier geht es zur Veranstaltung: https://commerce.codetalks.de/de

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.