1
 
 
Profil
In deinem persönlichen Profilbereich kannst du den Status deiner Bewerbung einsehen, unvollständige Bewerbungen zwischenspeichern und aktuelle News und Events einsehen
14. Mai 2021

Teil 2: Datenerhebung für Learning to Rank

Worum geht es in diesem Artikel?

Im letzten Beitrag haben wir beschrieben, welche Ziele wir mit der Implementierung von Learning to Rank (LTR) verfolgen und wie wir sie (methodisch) erreichen wollen. Aber wie kommen wir eigentlich an die Daten, die wir brauchen? Wie ermitteln wir die Rangfolge, die den größten Wert für unsere Kunden schafft? Was genau ist "Wert"/Relevanz aus Sicht des Kunden? Und wie definieren wir Merkmale, um diese Daten korrekt darzustellen? Wir werden versuchen, einige dieser Fragen in diesem Beitrag zu beantworten. In den folgenden Beiträgen wird es darum gehen, wie wir die Suchqualität messen und wie wir die technische Umsetzung einer LTR-Pipeline realisieren.

Beschriftete Daten erstellen

Wie definieren wir also die Relevanz und wie können wir die perfekte Reihenfolge der Produkte aus Sicht des Kunden bestimmen? Wir müssen beschriftete Daten erstellen. Der übliche Ansatz in der Datenwissenschaft ist Crowd Sourcing, d. h. die handwerkliche Beschriftung durch eine (möglichst große) Gruppe von Personen. Die Herausforderung im E-Commerce besteht darin, dass "Relevanz, mit der Absicht etwas zu kaufen" sich von der bloßen Frage "Wie relevant ist dieses Produkt für diese Anfrage?" unterscheidet. Daher sollten wir keine Crowd-Sourced-Daten für das Training verwenden. Stattdessen müssen wir die Relevanz aus den Kundeninteraktionen ableiten, die wir tagtäglich auf unserer Website sammeln. Die gebräuchlichsten KPIs hierfür sind Klicks, add4laters (add-to-carts und add-to-wish-lists), Bestellungen und Umsatz, aber auch andere Metriken können hilfreich sein, um die Relevanz aus Kundensicht zu bestimmen. Wie im vorherigen Beitrag(#1 Introduction in Learning to Rank for E-Commerce Search) erwähnt, könnten diese auch die Kundenaktivität auf der Produktdetailseite oder der Suchergebnisseite, die auf einer Detailseite verbrachte Zeit oder die zwischen Klicks/Scrolling/Lesen/... vergehende Zeit beschreiben.

Ziel der Optimierung
Nachdem wir die oben genannten Daten gesammelt haben, müssen wir entscheiden, welche wir als Grundlage für die Zielmetrik (genannt Judgements) für unser LTR-Modell verwenden wollen. Dazu führen wir Experimente durch, bei denen wir 50 Prozent unserer Kunden ein Ranking auf Basis von Judgement-Berechnungsansätzen zeigen, während die anderen 50 Prozent den Status Quo sehen. So können wir feststellen, ob die gewählte Zielmetrik eine gute Definition von Relevanz ist oder nicht.

Abbildung 1: Die Verwendung einer Bayesschen Wahrscheinlichkeitsmethode zur Modellierung der Klickwahrscheinlichkeit verbessert die Wahrscheinlichkeitsschätzung
Abbildung 1: Die Verwendung einer Bayesschen Wahrscheinlichkeitsmethode zur Modellierung der Klickwahrscheinlichkeit verbessert die Wahrscheinlichkeitsschätzung

Unser derzeitiger Ansatz zur Berechnung der Zielmetrik ist die Modellierung der Klickwahrscheinlichkeit für ein Produkt bei einer Suchanfrage. Wir berücksichtigen Klicks und Views von Produkten und berechnen die Klickwahrscheinlichkeit (Klicks/Views ~ Klickwahrscheinlichkeit). Wie in Abb. 1 zu sehen ist, führt die ausschließliche Verwendung von Klicks und Views zur Berechnung der Klickwahrscheinlichkeit zu wenig aussagekräftigen Ergebnissen, insbesondere bei niedrigen View-Zahlen. Um Produkten mit mehr Interaktion eine höhere statistische Signifikanz zu verleihen, wenden wir eine Bayes'sche Wahrscheinlichkeitsmethode an. Da wir die binomiale Wahrscheinlichkeitsverteilung betrachten, ob ein Produkt angeklickt wird (=1) oder nicht (=0), können wir die vorherige Wahrscheinlichkeitsverteilung mit der Beta-Verteilung modellieren. Wir bestimmen die Parameter der Beta-Verteilung aus historischen Interaktionsdaten. Für jedes Abfrage-Produkt-Paar modifizieren wir den Prior mit den beobachteten Klicks und Nicht-Klicks, um eine bessere Schätzung der Klickwahrscheinlichkeit zu erhalten (siehe Abb. 1).

Positionsverzerrung
Eine zusätzliche Herausforderung bei der Erfassung von Daten über gerankte Produkte ist die Positionsverzerrung. Wir testen derzeit verschiedene Ansätze, um diesen zu kompensieren, indem wir sein Ausmaß schätzen und auf der Grundlage dieses Wertes eine inverse Wahrscheinlichkeitsgewichtung anwenden. Insbesondere schätzen wir die zugrundeliegende Funktion der Positionsverzerrung und debias Interaktionsdaten mit dieser. Ein anderer Ansatz besteht darin, Klickwahrscheinlichkeiten oder Beta-Verteilungsprioritäten pro Position zu berechnen und die Positionsverzerrung zu schätzen, indem man ihre Unterschiede für Produkte betrachtet, die an unterschiedlichen Positionen in der Geschichte erscheinen. Neuere Ansätze in der Literatur versuchen, den Positionsbias direkt in das Learning-to-Rank-Modell einzubauen und so das Modell seinen Einfluss auf die Daten lernen zu lassen. Wir werden solche Ansätze in zukünftigen Iterationen testen.

Abbildung 2: Trainingsdatenbeispiel
Abbildung 2: Trainingsdatenbeispiel

Die Auswahl der richtigen Funktionen

Sobald wir die zu verwendende Zielmetrik definiert haben, können wir uns darauf konzentrieren, die richtigen Merkmale für das Training unseres Modells zu finden. Die derzeit verwendeten Merkmale sind abfrageabhängig, produktabhängig und beschreiben die Beziehungen zwischen Abfrage und Produkt (siehe Abb. 2). Wir beginnen mit einer fundierten Vermutung, die auf unserem Geschäftswissen basiert. Von diesem Punkt an iterieren wir und untersuchen die Merkmalskorrelationen und die Modellleistung (siehe Abb. 3). In Zukunft möchten wir auch Personalisierungsmerkmale, wie Alter oder Geschlecht, und Echtzeitmerkmale, wie Tageszeit oder Wochentag, einbeziehen.

Abbildung 3: Merkmalskorrelationsmatrix
Abbildung 3: Merkmalskorrelationsmatrix

Wenn diese Themen für Sie interessant klingen und/oder Sie Erfahrung im Aufbau von LTR-Modellen und der Gestaltung von Features oder Urteilen haben, würden wir uns freuen, mit Ihnen Ideen zu diskutieren oder Sie in unserem Team willkommen zu heißen -> kontaktieren Sie uns unter JARVIS@otto.de.

0Noch keine Kommentare

Dein Kommentar
Antwort auf:  Direkt auf das Thema antworten

Geschrieben von

Andrea Schütt
Andrea Schütt
Data Scientist

Ähnliche Beiträge

We want to improve out content with your feedback.

How interesting is this blogpost?

We have received your feedback.

Cookies erlauben?

OTTO und drei Partner brauchen deine Einwilligung (Klick auf "OK") bei einzelnen Datennutzungen, um Informationen auf einem Gerät zu speichern und/oder abzurufen (IP-Adresse, Nutzer-ID, Browser-Informationen).
Die Datennutzung erfolgt für personalisierte Anzeigen und Inhalte, Anzeigen- und Inhaltsmessungen sowie um Erkenntnisse über Zielgruppen und Produktentwicklungen zu gewinnen. Mehr Infos zur Einwilligung gibt’s jederzeit hier. Mit Klick auf den Link "Cookies ablehnen" kannst du deine Einwilligung jederzeit ablehnen.

Datennutzungen

OTTO arbeitet mit Partnern zusammen, die von deinem Endgerät abgerufene Daten (Trackingdaten) auch zu eigenen Zwecken (z.B. Profilbildungen) / zu Zwecken Dritter verarbeiten. Vor diesem Hintergrund erfordert nicht nur die Erhebung der Trackingdaten, sondern auch deren Weiterverarbeitung durch diese Anbieter einer Einwilligung. Die Trackingdaten werden erst dann erhoben, wenn du auf den in dem Banner auf otto.de wiedergebenden Button „OK” klickst. Bei den Partnern handelt es sich um die folgenden Unternehmen:
Google Ireland Limited, Meta Platforms Ireland Limited, LinkedIn Ireland Unlimited Company
Weitere Informationen zu den Datenverarbeitungen durch diese Partner findest du in der Datenschutzerklärung auf otto.de/jobs. Die Informationen sind außerdem über einen Link in dem Banner abrufbar.
Du kannst deine Einwilligung auch jederzeit grundlos mit Wirkung für die Zukunft widerrufen, indem du auf den Button "Cookie-Einstellungen" im Footer der Website und "Cookies ablehnen" klickst.