Show Menu
THEMEN×

Verpacken von Quelldateien in einem Rezept

Dieses Lernprogramm enthält Anweisungen dazu, wie Sie die angegebenen Quelldateien für den Einzelhandel in eine Archivdatei packen können, die zum Erstellen eines Rezepts in Adobe Experience Platform Data Science Workspace verwendet werden kann, indem Sie dem Skript-Import-Arbeitsablauf entweder in der Benutzeroberfläche oder mithilfe der API folgen.
Konzepte zum Verständnis:
  • Rezepte : Ein Rezept ist der von Adobe verwendete Begriff für eine Modellspezifikation. Es handelt sich dabei um einen Container auf oberster Ebene, der ein bestimmtes maschinelles Lernen, einen Algorithmus für künstliche Intelligenz oder ein Ensemble von Algorithmen, eine Verarbeitungslogik und eine Konfiguration darstellt, die zum Aufbau und Ausführen eines geschulten Modells erforderlich sind und somit zur Lösung spezifischer Geschäftsprobleme beitragen.
  • Quelldateien : Einzelne Dateien im Projekt, die die Logik für ein Rezept enthalten.

Rezepterstellung

Beginn zur Rezepterstellung mit Quelldateien zum Erstellen einer Archivdatei. Quelldateien definieren die Logik des maschinellen Lernens und Algorithmen, die zur Lösung eines bestimmten Problems verwendet werden, und werden entweder in Python, R, PySpark oder Scala geschrieben. Die erstellten Archivdateien haben die Form eines Dockerbilds. Nach der Erstellung wird die verpackte Archivdatei in Data Science Workspace importiert, um ein Rezept in der Benutzeroberfläche oder mithilfe der API zu erstellen.

Dockerbasiertes Modell-Authoring

Ein Docker-Bild ermöglicht es einem Entwickler, eine Anwendung mit allen benötigten Teilen wie Bibliotheken und anderen Abhängigkeiten zu verpacken und als ein Paket zu versenden.
Das erstellte Docker-Bild wird mit den Anmeldeinformationen, die Sie während des Rezepterstellungsarbeitsablaufs erhalten haben, in die Azurblaue Container-Registrierung verschoben.
Melden Sie sich zum Erhalt der Anmeldedaten für Ihre Azurblase Container-Registrierung bei platform.adobe.com Adobe Experience Platforman. Navigieren Sie in der linken Navigationsspalte zu Workflows . Wählen Sie Rezept importieren und anschließend Starten . Siehe Screenshot unten als Referenz.
Die Seite " Konfigurieren "wird geöffnet. Geben Sie einen entsprechenden Rezeptnamen ein, z. B. "Retail Sales recipe", und geben Sie optional eine Beschreibung oder eine Dokumentations-URL ein. Klicken Sie nach Abschluss des Vorgangs auf Weiter .
Wählen Sie die entsprechende Laufzeitumgebung und dann eine Klassifizierung für den Typ . Ihre Anmeldedaten für die Azurblase-Container-Registrierung werden nach Abschluss der Überprüfung generiert.
*Typ *ist die Klasse des maschinellen Lernproblems, für das das Rezept entwickelt wurde und nach dem Training verwendet wird, um die Beurteilung der Trainingslaufzeit anzupassen.
  • Wählen Sie für Python-Rezepte die Python -Laufzeit.
  • Wählen Sie für R-Rezepte die R -Laufzeit.
  • Wählen Sie für PySpark-Rezepte die PySpark -Laufzeit. Ein Artefakttyp wird automatisch gefüllt.
  • Wählen Sie für Scala-Rezepte die Spark -Laufzeit. Ein Artefakttyp wird automatisch gefüllt.
Notieren Sie die Werte für Docker-Host , Benutzername und Kennwort . Diese werden verwendet, um Ihr Docker-Bild in der Workflows unten beschrieben zu erstellen und zu verschieben.
Die Quell-URL wird nach Abschluss der unten beschriebenen Schritte bereitgestellt. Die Konfigurationsdatei wird in den nachfolgenden Übungen in den nächsten Schritten erläutert.

Verpacken der Quelldateien

Beginn durch Abrufen der Codebasis für Beispieldateien im experience-platform-dsw-reference Experience Platform Data Science Workspace Reference -Repository.

Python-Docker-Bild erstellen

Falls nicht, klonen Sie das github-Repository mit dem folgenden Befehl auf Ihrem lokalen System:
git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigate to the directory experience-platform-dsw-reference/recipes/python/retail . Hier finden Sie die Skripte login.sh und build.sh benutzt, um sich bei Docker anzumelden und das Python Docker-Bild zu erstellen. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge ein:
# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Beachten Sie, dass Sie beim Ausführen des Anmeldeskripts den Docker-Host, den Benutzernamen und das Kennwort angeben müssen. Beim Erstellen müssen Sie den Docker-Host und ein Version-Tag für den Build angeben.
Nachdem das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in der Konsolenausgabe. Für dieses spezifische Beispiel sieht es wie folgt aus:
# URL format: 
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}

Kopieren Sie diese URL und gehen Sie zu den nächsten Schritten .

R-Docker-Bild erstellen

Falls nicht, klonen Sie das github-Repository mit dem folgenden Befehl auf Ihrem lokalen System:
git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie zum Ordner experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting im geklonten Repository. Hier finden Sie die Dateien login.sh und build.sh die Sie verwenden werden, um sich bei Docker anzumelden und das R Docker-Bild zu erstellen. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge ein:
# for logging in to Docker
./login.sh
 
# for build Docker image
./build.sh

Beachten Sie, dass Sie beim Ausführen des Anmeldeskripts den Docker-Host, den Benutzernamen und das Kennwort angeben müssen. Beim Erstellen müssen Sie den Docker-Host und ein Version-Tag für den Build angeben.
Nachdem das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in der Konsolenausgabe. Für dieses spezifische Beispiel sieht es wie folgt aus:
# URL format: 
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}

Kopieren Sie diese URL und gehen Sie zu den nächsten Schritten .

PySpark Docker-Bild erstellen

Beginn durch Klonen des github-Repositorys auf Ihrem lokalen System mit folgendem Befehl:
git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigate to the directory experience-platform-dsw-reference/recipes/pyspark/retail . Die Skripten login.sh und build.sh sind hier zu finden und zum Anmelden bei Docker und zum Erstellen des Docker-Bildes. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge ein:
# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Beachten Sie, dass Sie beim Ausführen des Anmeldeskripts den Docker-Host, den Benutzernamen und das Kennwort angeben müssen. Beim Erstellen müssen Sie den Docker-Host und ein Version-Tag für den Build angeben.
Nachdem das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in der Konsolenausgabe. Für dieses spezifische Beispiel sieht es wie folgt aus:
# URL format: 
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}

Kopieren Sie diese URL und gehen Sie zu den nächsten Schritten .

Erstellen eines Skala-Dockerbilds

Beginn durch Klonen des github-Repositorys auf Ihrem lokalen System mit dem folgenden Befehl im Terminal:
git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie anschließend zum Ordner, in dem Sie die Skripte experience-platform-dsw-reference/recipes/scala/retail und login.sh build.sh die Skripte finden können. Diese Skripten werden verwendet, um sich bei Docker anzumelden und das Docker-Bild zu erstellen. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge ein:
# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Beim Ausführen des Anmeldeskripts müssen Sie den Docker-Host, den Benutzernamen und das Kennwort angeben. Beim Erstellen müssen Sie den Docker-Host und ein Version-Tag für den Build angeben.
Nachdem das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in der Konsolenausgabe. Für dieses spezifische Beispiel sieht es wie folgt aus:
# URL format: 
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}

Kopieren Sie diese URL und gehen Sie zu den nächsten Schritten .

Nächste Schritte

Diese Übung übernahm das Verpacken von Quelldateien in ein Rezept, die Voraussetzung für den Import eines Rezepts in Data Science Workspace. Sie sollten jetzt ein Docker-Bild in der Azurblauen Container-Registrierung zusammen mit der entsprechenden Bild-URL haben. Sie können jetzt mit dem Lernprogramm zum Importieren eines zusammengestellten Rezepts in den Data Science Workspace beginnen. Wählen Sie einen der folgenden Links, um zu beginnen.

Erstellen von Binärdateien (nicht mehr unterstützt)

Binärdateien werden in neuen PySpark- und Scala-Rezepten nicht unterstützt und sind in einer zukünftigen Version zu entfernen. Bitte folgen Sie dem Docker Workflows , wenn Sie mit PySpark und Scala arbeiten. Die folgenden Workflows gelten nur für Spark 2.3-Rezepte.

PySpark-Binärdateien erstellen (nicht mehr unterstützt)

Falls nicht, klonen Sie das github-Repository mit dem folgenden Befehl auf Ihrem lokalen System:
git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie zum geklonten Repository auf Ihrem lokalen System und führen Sie die folgenden Befehle aus, um die erforderliche .egg Datei zum Importieren eines PySpark-Rezeptes zu erstellen:
cd recipes/pyspark
./build.sh

Die .egg Datei wird im dist Ordner generiert.
Sie können jetzt zu den nächsten Schritten fortfahren.

Scala-Binärdateien erstellen (nicht mehr unterstützt)

Wenn Sie dies noch nicht getan haben, führen Sie den folgenden Befehl aus, um das Github-Repository auf Ihrem lokalen System zu klonen:
git clone https://github.com/adobe/experience-platform-dsw-reference.git

Um das .jar Artefakt zum Importieren eines Scala-Rezepts zu erstellen, navigieren Sie zu Ihrem geklonten Repository und führen Sie die folgenden Schritte aus:
cd recipes/scala/
./build.sh

Das generierte .jar Artefakt mit Abhängigkeiten befindet sich im /target Verzeichnis.
Sie können jetzt zu den nächsten Schritten fortfahren.