Show Menu
THEMEN×

Exemplarische Vorgehensweise zum Erstellen und Veröffentlichen eines maschinellen Lernmodells

Tun Sie so, als ob Sie eine Online-Einzelhandelswebsite besitzen. Wenn Ihre Kunden auf Ihrer Retail-Website einkaufen, möchten Sie ihnen personalisierte Produktempfehlungen präsentieren, um eine Reihe anderer Produkte Ihrer geschäftlichen Angebot verfügbar zu machen. Im Laufe der Existenz Ihrer Website haben Sie kontinuierlich Kundendaten gesammelt und möchten diese Daten irgendwie zur Erstellung personalisierter Produktempfehlungen verwenden.
Adobe Experience Platform Data Science Workspace bietet die Möglichkeit, Ihr Ziel mithilfe des vordefinierten Produktempfehlungsrezepts zu erreichen. In diesem Lernprogramm erfahren Sie, wie Sie auf Ihre Einzelhandelsdaten zugreifen und diese verstehen, ein Modell für maschinelles Lernen erstellen und optimieren und Einblicke in Data Science Workspace generieren können.
Dieses Lernprogramm spiegelt den Arbeitsablauf von Data Science Workspace wider und behandelt die folgenden Schritte zum Erstellen eines Modells für maschinelles Lernen:

Erste Schritte

Bevor Sie dieses Lernprogramm starten, müssen Sie über die folgenden Voraussetzungen verfügen:
  • Zugriff auf Adobe Experience Platform. Wenn Sie keinen Zugriff auf eine IMS-Organisation in Experience Platform haben, wenden Sie sich an Ihren Systemadministrator, bevor Sie fortfahren.
  • Aktivieren von Assets. Wenden Sie sich an Ihren Kundenbetreuer, um die folgenden Punkte für Sie bereitzustellen.
    • Recommendations-Rezept
    • Recommendations-Eingabedaten
    • Recommendations Input-Schema
    • Recommendations Output DataSet
    • Recommendations Output Schema
    • Golden Data Set postValues
    • Goldenes Datenset-Schema
  • Laden Sie die drei erforderlichen Jupyter-Notebook-Dateien aus dem öffentlichen Notebooks-Thurs Adobe-Git-Repositoryherunter. Diese werden verwendet, um den JupyterLab-Arbeitsablauf in Data Science Workspace zu demonstrieren.
  • Ein Arbeitsverständnis mit den folgenden Schlüsselkonzepten, die in diesem Lernprogramm verwendet werden:
    • Erlebnisdatenmodell : Die Standardisierungsarbeit, die Adobe zur Definition von Standard-Schemas wie Profil und ExperienceEvent für Customer Experience Management führt.
    • Datensätze: Ein Datenspeicherung- und Verwaltungskonstrukt für tatsächliche Daten. Eine physische instanziierte Instanz eines XDM-Schemas .
    • Stapel: Datensätze bestehen aus Stapeln. Ein Stapel ist ein Datensatz, der über einen bestimmten Zeitraum erfasst und als eine Einheit verarbeitet wird.
    • JupyterLab: JupyterLab ist eine webbasierte Open-Source-Schnittstelle für Project Jupyter und ist eng in Experience Platform integriert.

Daten vorbereiten

Um ein Modell für maschinelles Lernen zu erstellen, das Ihren Kunden personalisierte Produktempfehlungen zukommen lässt, müssen frühere Käufe auf Ihrer Website analysiert werden. In diesem Abschnitt wird untersucht, wie diese Daten in Plattform integriert werden Adobe Analyticsund wie diese Daten in einen Funktionsdatensatz umgewandelt werden, der von Ihrem maschinellen Lernmodell verwendet werden soll.

Daten und Schemas

  1. Melden Sie sich bei Adobe Experience Platform an und klicken Sie auf Datasets , um alle vorhandenen Datensätze Liste, und wählen Sie den Datensatz aus, den Sie untersuchen möchten. In diesem Fall ist der Analytics-Datensatz Golden Data Set postValues .
  2. Wählen Sie oben rechts die Option " Vorschau-Datensatz ", um die Musterdatensätze zu prüfen, und klicken Sie dann auf Schließen .
  3. Wählen Sie den Link unter Schema in der rechten Leiste aus, um das Schema für den Datensatz Ansicht, und gehen Sie dann zurück zur Seite mit den Datensatzdetails."
Die anderen Datensätze wurden zur Vorschau mit Stapeln vorausgefüllt. Sie können diese Datensätze durch Wiederholen der oben genannten Schritte Ansicht werden.
Dataset-Name
Schema
Beschreibung
Golden Data Set postValues
Goldenes Datenset-Schema
Analytics-Quelldaten von Ihrer Website
Recommendations-Eingabedaten
Recommendations Input-Schema
Die Analytics-Daten werden mithilfe einer Feature-Pipeline in einen Schulungsdatensatz umgewandelt. Diese Daten werden zur Schulung des maschinellen Lernmodells von Produktempfehlungen verwendet. itemid und userid einem von diesem Kunden erworbenen Produkt entsprechen.
Recommendations Output DataSet
Recommendations Output Schema
Der Datensatz, für den die Bewertungsergebnisse gespeichert werden, enthält die Liste der empfohlenen Produkte für jeden Kunden.

Modell erstellen

Die zweite Komponente des Data Science Workspace-Lebenszyklus umfasst das Authoring von Rezepten und Modellen. Das Rezept "Produktempfehlungen"wurde entwickelt, um Produktempfehlungen im Maßstab zu generieren, indem alte Kaufdaten und maschinelles Lernen verwendet werden.
Rezepte bilden die Grundlage für ein Modell, da sie maschinelle Lernalgorithmen und Logik zur Lösung spezifischer Probleme enthalten. Wichtiger noch: Rezepte ermöglichen es Ihnen, das maschinelle Lernen in Ihrer gesamten Organisation zu demokratisieren, sodass andere Benutzer auf ein Modell für unterschiedliche Anwendungsfälle zugreifen können, ohne Code schreiben zu müssen.

Produktempfehlungen-Rezept

  1. Navigieren Sie Adobe Experience Platformin der linken Navigationsspalte zu Modellen und klicken Sie dann oben auf Rezepte , um eine Liste der verfügbaren Rezepte für Ihr Unternehmen Ansicht.
  2. Suchen und öffnen Sie das bereitgestellte Recommendations-Rezept , indem Sie auf seinen Namen klicken.
  3. Klicken Sie in der rechten Leiste auf Recommendations Input Schema , um das Schema mit dem Skript zu Ansicht. Die Schema-Felder itemId und userId entsprechen einem Produkt, das von diesem Kunden zu einem bestimmten Zeitpunkt gekauft wurde ( interactionType ) ( timestamp ). Führen Sie die gleichen Schritte aus, um die Felder für das Recommendations Output-Schema ​zu überprüfen.
Sie haben jetzt die Eingabe- und Ausgabeformate überprüft, die für das Produktempfehlungsrezept erforderlich sind. Sie können nun mit dem nächsten Abschnitt fortfahren, um herauszufinden, wie ein Produktempfehlungsmodell erstellt, trainiert und ausgewertet wird.

Trainieren und Auswerten Ihres Modells

Nachdem Ihre Daten vorbereitet und das Rezept einsatzbereit ist, können Sie Ihr Modell für maschinelles Lernen erstellen, ausbilden und auswerten.

Modell erstellen

Ein Modell ist eine Instanz eines Rezeptes, mit dem Sie mit Daten im Maßstab trainieren und bewerten können.
  1. Navigieren Sie Adobe Experience Platformin der linken Navigationsspalte zu Modellen und klicken Sie dann oben auf der Seite auf Rezepte , um eine Liste aller für Ihr Unternehmen verfügbaren Rezepte anzuzeigen.
  2. Suchen und öffnen Sie das bereitgestellte Empfehlungsrezept , indem Sie auf seinen Namen klicken und die Übersichtsseite des Rezepts eingeben. Klicken Sie entweder von der Mitte aus (sofern keine vorhandenen Modelle vorhanden sind) oder oben rechts auf der Seite "Rezept-Übersicht"auf "Modell erstellen ".
  3. Es wird eine Liste der verfügbaren Eingabedaten für Schulungen angezeigt, wählen Sie " Recommendations-Eingabedatensatz "und klicken Sie auf Weiter .
  4. Geben Sie einen Namen für das Modell ein, z. B. "Produktempfehlungsmodell". Die verfügbaren Konfigurationen für das Modell werden aufgelistet und enthalten Einstellungen für das Standardschulungs- und Bewertungsverhalten des Modells. Es sind keine Änderungen erforderlich, da diese Konfigurationen für Ihr Unternehmen spezifisch sind. Überprüfen Sie die Konfigurationen und klicken Sie auf Fertig stellen .
  5. Das Modell wurde jetzt erstellt und die Seite Übersicht des Modells wird in einem neu erstellten Schulungslauf angezeigt. Beim Erstellen eines Modells wird standardmäßig ein Schulungslauf generiert.
Sie können auf den Abschluss des Schulungslaufs warten oder im folgenden Abschnitt eine neue Schulungsausführung erstellen.

Modell mithilfe benutzerdefinierter Hyperparameter trainieren

  1. Klicken Sie auf der Seite Modellübersicht oben rechts auf Zug , um einen neuen Schulungslauf zu erstellen. Wählen Sie denselben Eingabedatensatz, den Sie beim Erstellen des Modells verwendet haben, und klicken Sie auf Weiter .
  2. Die Seite " Konfiguration "wird angezeigt. Hier können Sie den Wert num_recommendations des Schulungslaufs konfigurieren, auch als Hyperparameter bezeichnet. Ein geschultes und optimiertes Modell verwendet die leistungsstärksten Hyperparameter, die auf den Ergebnissen der Schulungsausführung basieren.
    Hyperparameter können nicht erlernt werden, daher müssen sie vor Schulungsdurchläufen zugewiesen werden. Die Anpassung von Hyperparametern kann die Genauigkeit des eingeübten Modells ändern. Da die Optimierung eines Modells ein iterativer Prozess ist, kann es erforderlich sein, dass mehrere Schulungen durchgeführt werden, bevor eine zufriedenstellende Bewertung erreicht wird.
    Setzen Sie num_recommendations auf 10.
  3. Ein zusätzlicher Datenpunkt wird auf dem Modellbewertungsdiagramm angezeigt, sobald der neue Schulungslauf abgeschlossen ist. Dies kann bis zu mehreren Minuten dauern.

Modell bewerten

Bei jedem Abschluss eines Schulungslaufs können Sie die resultierenden Bewertungsmetriken zur Ansicht der Leistung des Modells festlegen.
  1. Überprüfen Sie die Bewertungsmetriken (Präzision und Rückruf) für jede abgeschlossene Schulung, indem Sie auf den Schulungslauf klicken.
  2. Informationen zu den einzelnen Bewertungsmetriken Je höher diese Metriken sind, desto besser hat das Modell funktioniert.
  3. Sie können den Datensatz, das Schema und die Konfigurationsparameter anzeigen, die für jeden Schulungslauf auf der rechten Leiste verwendet werden.
  4. Navigieren Sie zurück zur Modellseite und identifizieren Sie die Schulungen mit der höchsten Leistung, indem Sie deren Bewertungsmetriken beobachten.

Modell operationalisieren

Der letzte Schritt im Data Science-Arbeitsablauf besteht darin, Ihr Modell zu operieren, um Erkenntnisse aus Ihrem Datenspeicher zu bewerten und zu nutzen.

Bewertung und Erstellung von Einblicken

  1. Klicken Sie auf der Seite "Produktempfehlungen - Modellübersicht"auf den Namen des Schulungslaufs mit den höchsten Rückruf- und Genauigkeitswerten .
  2. Klicken Sie oben rechts auf der Seite mit den Details zum Schulungslauf auf Ergebnis .
  3. Wählen Sie das Recommendations-Eingabedataset als Bewertungseingabedataset aus, das mit dem Datensatz identisch ist, den Sie beim Erstellen des Modells und bei der Ausführung der Schulungen verwendet haben. Klicken Sie dann auf Weiter .
  4. Wählen Sie das Recommendations-Ausgabedataset als Bewertungsausgabedataset aus. Die Bewertungsergebnisse werden in diesem Datensatz als Stapel gespeichert.
  5. Überprüfen Sie die Bewertungskonfigurationen. Diese Parameter enthalten die zuvor ausgewählten Eingabe- und Ausgabedaten zusammen mit den entsprechenden Schemas. Klicken Sie auf Fertig stellen , um mit dem Bewertungsvorgang zu beginnen. Die Ausführung kann mehrere Minuten dauern.

Ansicht erzielte Einblicke

Nach erfolgreichem Abschluss der Bewertungsausführung können Sie die Ergebnisse Vorschau und Ansicht der gewonnenen Erkenntnisse vornehmen.
  1. Klicken Sie auf der Seite mit den Bewertungsergebnissen auf die abgeschlossene Bewertungsausführung und klicken Sie dann auf der rechten Leiste auf Vorschau Scoring Results Dataset .
  2. In der Tabelle "Vorschau"enthält jede Zeile Produktempfehlungen für einen bestimmten Kunden, die als Recommendations bzw. userId beschriftet sind. Da der Hyperparameter num_recommendations in den Screenshots auf 10 gesetzt wurde, kann jede Empfehlungszeile bis zu 10 Produktidentitäten enthalten, die durch ein Nummernzeichen (#) getrennt sind.

Nächste Schritte

Gut gemacht, Sie haben erfolgreich Produktempfehlungen generiert!
In diesem Lernprogramm wurde der Arbeitsablauf von Data Science Workspace vorgestellt, in dem gezeigt wird, wie unverarbeitete Rohdaten durch maschinelles Lernen in nützliche Informationen umgewandelt werden können. Um mehr über die Verwendung des Data Science Workspace zu erfahren, fahren Sie mit dem nächsten Handbuch zur Erstellung des Schemas und Datensatzes für den Einzelhandel fort.