Kaggle: Machine Learning Wettbewerb für das beste multi-objektive Empfehlungssystem
Große Online-Händler wie OTTO bieten ihren Kund*innen Millionen von Produkten zum Stöbern und Kaufen an. Das richtige Produkt aus dieser riesigen Auswahl zu finden, kann jedoch ohne eine kleine Hilfestellung sehr anstrengend sein. Deshalb arbeiten wir daran, unsere Kund*innen zu den Produkten zu führen, die ihren Interessen und Motiven am besten entsprechen, indem wir personalisierte Empfehlungen anzeigen. Aus diesem Grund wollen wir unsere Fähigkeit verbessern, in Echtzeit vorherzusagen, welche Produkte jede*r Kund*in zu einem bestimmten Zeitpunkt des Besuchs sehen, in seinen Warenkorb legen und bestellen möchte.
Obwohl sich in den letzten Jahren eine aktive Forschungsgemeinschaft im Bereich der Empfehlungssysteme etabliert hat, mangelt es immer noch an groß angelegten Datensätzen zur Nutzerinteraktion im E-Commerce-Bereich. Infolgedessen besteht die Gefahr, dass neu veröffentlichte Modelle nicht ausreichend skalierbar sind, wenn sie auf Einzelhändler der Größe von OTTO angewendet werden. Um dieses Problem anzugehen und die weitere Forschung auf dem Gebiet der sitzungsbasierten Empfehlungen zu unterstützen, haben wir uns entschlossen, einen großen Datensatz zu veröffentlichen, den wir aus anonymisierten Verhaltensprotokollen unseres Webshops und unserer Shopping-App gewonnen haben.
Um die Popularität unseres Datensatzes zu sichern, wurde uns schnell klar, dass die Kombination mit einem unterhaltsamen Wettbewerb der beste Weg sein könnte, um Tausende von Forschungsteams für unsere Daten zu interessieren! Daher haben wir uns entschlossen, diesen Wettbewerb auf der beliebten Data-Science-Plattform Kaggle zu starten und für die drei besten Einsendungen ein Preisgeld von 30.000 Dollar bereitzustellen. Unser Wettbewerb beginnt am 01. November 2022 und wir laden alle, die sich für die Anwendung des maschinellen Lernens auf reale Probleme interessieren, herzlich ein, hier mitzumachen. Der Wettbewerb läuft drei Monate und endet am 31. Januar 2023. Um Ihnen den Einstieg zu erleichtern, stellen wir auch ein GitHub-Repository mit einer vollständigen Datensatzbeschreibung und Auswertungsskripten zur Verfügung.
Die Aufgabe, die wir unseren Teilnehmern stellen wollen, lautet ein multikriterielles Empfehlungsmodell zu erstellen, um sowohl die Klick- als auch die Kaufrate der empfohlenen Artikel zu optimieren. Die meisten aktuellen State-of-the-Art-Modelle optimieren nur die CTR, daher hoffen wir, dass diese Mehrzielaufgabe eine spannende Herausforderung für die ML-Community darstellt. Mach jetzt mit!
Möchtest du mitmachen?
We have received your feedback.