Navigation

Profil

In deinem persönlichen Profilbereich kannst du den Status deiner Bewerbung einsehen, unvollständige Bewerbungen zwischenspeichern und aktuelle News und Events einsehen

Einloggen Registrieren

deDeutsch

enEnglisch

deDeutsch

14. Mai 2021

Teil 2: Datenerhebung für Learning to Rank

Worum geht es in diesem Artikel?

Im letzten Beitrag haben wir beschrieben, welche Ziele wir mit der Implementierung von Learning to Rank (LTR) verfolgen und wie wir sie (methodisch) erreichen wollen. Aber wie kommen wir eigentlich an die Daten, die wir brauchen? Wie ermitteln wir die Rangfolge, die den größten Wert für unsere Kunden schafft? Was genau ist "Wert"/Relevanz aus Sicht des Kunden? Und wie definieren wir Merkmale, um diese Daten korrekt darzustellen? Wir werden versuchen, einige dieser Fragen in diesem Beitrag zu beantworten. In den folgenden Beiträgen wird es darum gehen, wie wir die Suchqualität messen und wie wir die technische Umsetzung einer LTR-Pipeline realisieren.

Beschriftete Daten erstellen

Wie definieren wir also die Relevanz und wie können wir die perfekte Reihenfolge der Produkte aus Sicht des Kunden bestimmen? Wir müssen beschriftete Daten erstellen. Der übliche Ansatz in der Datenwissenschaft ist Crowd Sourcing, d. h. die handwerkliche Beschriftung durch eine (möglichst große) Gruppe von Personen. Die Herausforderung im E-Commerce besteht darin, dass "Relevanz, mit der Absicht etwas zu kaufen" sich von der bloßen Frage "Wie relevant ist dieses Produkt für diese Anfrage?" unterscheidet. Daher sollten wir keine Crowd-Sourced-Daten für das Training verwenden. Stattdessen müssen wir die Relevanz aus den Kundeninteraktionen ableiten, die wir tagtäglich auf unserer Website sammeln. Die gebräuchlichsten KPIs hierfür sind Klicks, add4laters (add-to-carts und add-to-wish-lists), Bestellungen und Umsatz, aber auch andere Metriken können hilfreich sein, um die Relevanz aus Kundensicht zu bestimmen. Wie im vorherigen Beitrag(#1 Introduction in Learning to Rank for E-Commerce Search) erwähnt, könnten diese auch die Kundenaktivität auf der Produktdetailseite oder der Suchergebnisseite, die auf einer Detailseite verbrachte Zeit oder die zwischen Klicks/Scrolling/Lesen/... vergehende Zeit beschreiben.

Ziel der Optimierung
Nachdem wir die oben genannten Daten gesammelt haben, müssen wir entscheiden, welche wir als Grundlage für die Zielmetrik (genannt Judgements) für unser LTR-Modell verwenden wollen. Dazu führen wir Experimente durch, bei denen wir 50 Prozent unserer Kunden ein Ranking auf Basis von Judgement-Berechnungsansätzen zeigen, während die anderen 50 Prozent den Status Quo sehen. So können wir feststellen, ob die gewählte Zielmetrik eine gute Definition von Relevanz ist oder nicht.

Abbildung 1: Die Verwendung einer Bayesschen Wahrscheinlichkeitsmethode zur Modellierung der Klickwahrscheinlichkeit verbessert die Wahrscheinlichkeitsschätzung

Unser derzeitiger Ansatz zur Berechnung der Zielmetrik ist die Modellierung der Klickwahrscheinlichkeit für ein Produkt bei einer Suchanfrage. Wir berücksichtigen Klicks und Views von Produkten und berechnen die Klickwahrscheinlichkeit (Klicks/Views ~ Klickwahrscheinlichkeit). Wie in Abb. 1 zu sehen ist, führt die ausschließliche Verwendung von Klicks und Views zur Berechnung der Klickwahrscheinlichkeit zu wenig aussagekräftigen Ergebnissen, insbesondere bei niedrigen View-Zahlen. Um Produkten mit mehr Interaktion eine höhere statistische Signifikanz zu verleihen, wenden wir eine Bayes'sche Wahrscheinlichkeitsmethode an. Da wir die binomiale Wahrscheinlichkeitsverteilung betrachten, ob ein Produkt angeklickt wird (=1) oder nicht (=0), können wir die vorherige Wahrscheinlichkeitsverteilung mit der Beta-Verteilung modellieren. Wir bestimmen die Parameter der Beta-Verteilung aus historischen Interaktionsdaten. Für jedes Abfrage-Produkt-Paar modifizieren wir den Prior mit den beobachteten Klicks und Nicht-Klicks, um eine bessere Schätzung der Klickwahrscheinlichkeit zu erhalten (siehe Abb. 1).

Positionsverzerrung
Eine zusätzliche Herausforderung bei der Erfassung von Daten über gerankte Produkte ist die Positionsverzerrung. Wir testen derzeit verschiedene Ansätze, um diesen zu kompensieren, indem wir sein Ausmaß schätzen und auf der Grundlage dieses Wertes eine inverse Wahrscheinlichkeitsgewichtung anwenden. Insbesondere schätzen wir die zugrundeliegende Funktion der Positionsverzerrung und debias Interaktionsdaten mit dieser. Ein anderer Ansatz besteht darin, Klickwahrscheinlichkeiten oder Beta-Verteilungsprioritäten pro Position zu berechnen und die Positionsverzerrung zu schätzen, indem man ihre Unterschiede für Produkte betrachtet, die an unterschiedlichen Positionen in der Geschichte erscheinen. Neuere Ansätze in der Literatur versuchen, den Positionsbias direkt in das Learning-to-Rank-Modell einzubauen und so das Modell seinen Einfluss auf die Daten lernen zu lassen. Wir werden solche Ansätze in zukünftigen Iterationen testen.

Die Auswahl der richtigen Funktionen

Sobald wir die zu verwendende Zielmetrik definiert haben, können wir uns darauf konzentrieren, die richtigen Merkmale für das Training unseres Modells zu finden. Die derzeit verwendeten Merkmale sind abfrageabhängig, produktabhängig und beschreiben die Beziehungen zwischen Abfrage und Produkt (siehe Abb. 2). Wir beginnen mit einer fundierten Vermutung, die auf unserem Geschäftswissen basiert. Von diesem Punkt an iterieren wir und untersuchen die Merkmalskorrelationen und die Modellleistung (siehe Abb. 3). In Zukunft möchten wir auch Personalisierungsmerkmale, wie Alter oder Geschlecht, und Echtzeitmerkmale, wie Tageszeit oder Wochentag, einbeziehen.

Wenn diese Themen für Sie interessant klingen und/oder Sie Erfahrung im Aufbau von LTR-Modellen und der Gestaltung von Features oder Urteilen haben, würden wir uns freuen, mit Ihnen Ideen zu diskutieren oder Sie in unserem Team willkommen zu heißen -> kontaktieren Sie uns unter JARVIS@otto.de.

Jobs im Team Search

2 Personen gefällt das