Show Menu
SUJETS×

Regroupement des fichiers source dans une recette

This tutorial provides instructions on how you can package the provided Retail Sales sample source files into an archive file, which can be used to create a recipe in Adobe Experience Platform Data Science Workspace by following the recipe import workflow either in the UI or using the API.
Concepts à comprendre :
  • Recettes  : une recette est le terme utilisé par Adobe pour désigner une spécification de modèle. Il s’agit d’un conteneur de niveau supérieur qui représente un apprentissage automatique spécifique, un algorithme d’intelligence artificielle ou un ensemble d’algorithmes, une logique de traitement et la configuration nécessaires pour créer et exécuter un modèle formé et ainsi aider à résoudre des problèmes d’entreprise spécifiques.
  • Fichiers source  : fichiers individuels de votre projet contenant la logique pour une recette.

Création de recettes

La création de recettes commence par le regroupement des fichiers afin de créer un fichier d’archives. Source files define the machine learning logic and algorithms used to solve a specific problem at hand, and are written in either Python, R, PySpark, or Scala. Les fichiers d'archives créés prennent la forme d'une image Docker. Once built, the packaged archive file is imported into Data Science Workspace to create a recipe in the UI or using the API .

Création de modèles basés sur Docker

Une image Docker permet au développeur d’empaqueter une application avec tous les éléments dont elle a besoin, comme les bibliothèques et autres dépendances, et de l’expédier sous forme d’un package unique.
L'image Docker construite est envoyée au Registre du Conteneur Azure à l'aide des informations d'identification qui vous ont été fournies pendant le processus de création de la recette.
Pour obtenir vos informations d’identification Azure Container Registry, connectez-vous à Adobe Experience Platform . Dans la colonne de navigation de gauche, accédez aux Workflows . Sélectionnez Importer la recette , puis sélectionnez Lancement . Voir la capture d’écran ci-dessous pour référence.
La page Configurer s’ouvre. Indiquez un nom de recette approprié, par exemple « Recette des ventes au détail », et éventuellement une description ou une URL de documentation. Une fois terminé, cliquez sur Suivant .
Select the appropriate Runtime , then choose a Classification for Type . Les informations d'identification de votre Registre Azure Conteneur sont générées une fois l'opération terminée.
Type est la classe de problème d'apprentissage automatique pour laquelle la recette est conçue et est utilisée après la formation pour aider à personnaliser l'évaluation de la course de formation.
  • Pour Python les recettes, sélectionnez l'exécution Python .
  • Pour les recettes R, sélectionnez le runtime R .
  • Pour les recettes PySpark, sélectionnez le runtime PySpark . Un type d’artefact est renseigné automatiquement.
  • Pour les recettes Scala, sélectionnez le runtime Spark . Un type d’artefact est renseigné automatiquement.
Notez les valeurs de l'hôte Docker, du nom d'utilisateur et du mot de passe. Elles sont utilisées pour créer et pousser votre Docker image dans les workflows décrits ci-dessous.
L’URL source est fournie après avoir exécuté les étapes décrites ci-dessous. Le fichier de configuration est expliqué dans les didacticiels suivants, qui se trouvent dans les étapes Étapes suivantes suivantes.

Regroupement des fichiers source

Commencez par obtenir l’exemple de code de base trouvé dans le référentiel experience-platform-dsw-reference Experience Platform Data Science Workspace Reference.

Build Python Docker image

If you have not done so, clone the GitHub repository onto your local system with the following command:
git clone https://github.com/adobe/experience-platform-dsw-reference.git

Accédez au répertoire experience-platform-dsw-reference/recipes/python/retail . Ici, vous trouverez les scripts login.sh et build.sh utilisés pour vous connecter à Docker et pour construire l' Python Docker image. Si vos informations d’identification Docker sont prêtes, saisissez les commandes suivantes dans l’ordre :
# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Notez que lors de l'exécution du script de connexion, vous devez fournir l'hôte, le nom d'utilisateur et le mot de passe du Docker. Lors de la création, vous devez fournir l’hôte Docker et une balise de version pour la génération.
Une fois le script de génération terminé, vous recevez une URL de fichier source Docker dans la sortie de la console. Pour cet exemple spécifique, il se présente comme suit :
# URL format: 
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}

Copiez cette URL et passez aux étapes suivantes .

Build R Docker image

If you have not done so, clone the GitHub repository onto your local system with the following command:
git clone https://github.com/adobe/experience-platform-dsw-reference.git

Accédez au répertoire experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting dans votre référentiel cloné. Here, you'll find the files login.sh and build.sh which you will use to login to Docker and to build the R Docker image. Si vos informations d’identification Docker sont prêtes, saisissez les commandes suivantes dans l’ordre :
# for logging in to Docker
./login.sh
 
# for build Docker image
./build.sh

Notez que lors de l'exécution du script de connexion, vous devez fournir l'hôte, le nom d'utilisateur et le mot de passe du Docker. Lors de la création, vous devez fournir l’hôte Docker et une balise de version pour la génération.
Une fois le script de génération terminé, vous recevez une URL de fichier source Docker dans la sortie de la console. Pour cet exemple spécifique, il se présente comme suit :
# URL format: 
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}

Copiez cette URL et passez aux étapes suivantes .

Création d’une image PySpark Docker

Début en clonant le référentiel GitHub sur votre système local avec la commande suivante :
git clone https://github.com/adobe/experience-platform-dsw-reference.git

Accédez au répertoire experience-platform-dsw-reference/recipes/pyspark/retail . Les scripts login.sh et build.sh sont situés ici et utilisés pour se connecter au Docker et pour créer l'image du Docker. Si vos informations d’identification Docker sont prêtes, saisissez les commandes suivantes dans l’ordre :
# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Notez que lors de l'exécution du script de connexion, vous devez fournir l'hôte, le nom d'utilisateur et le mot de passe du Docker. Lors de la création, vous devez fournir l’hôte Docker et une balise de version pour la génération.
Une fois le script de génération terminé, vous recevez une URL de fichier source Docker dans la sortie de la console. Pour cet exemple spécifique, il se présente comme suit :
# URL format: 
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}

Copiez cette URL et passez aux étapes suivantes .

Création d’une image Scala Docker

Début en clonant le référentiel GitHub sur votre système local avec la commande suivante en terminal :
git clone https://github.com/adobe/experience-platform-dsw-reference.git

Accédez ensuite au répertoire experience-platform-dsw-reference/recipes/scala dans lequel vous trouverez les scripts login.sh et build.sh . Ces scripts sont utilisés pour se connecter au Docker et créer l'image du Docker. If you have your Docker credentials ready, enter the following commands to terminal in order:
# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Si vous recevez une erreur d'autorisation lors de la tentative de connexion au Docker à l'aide du login.sh script, essayez d'utiliser la commande bash login.sh .
Lors de l'exécution du script de connexion, vous devez indiquer l'hôte, le nom d'utilisateur et le mot de passe du Docker. Lors de la création, vous devez fournir l’hôte Docker et une balise de version pour la génération.
Une fois le script de génération terminé, vous recevez une URL de fichier source Docker dans la sortie de la console. Pour cet exemple spécifique, il se présente comme suit :
# URL format: 
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}

Copiez cette URL et passez aux étapes suivantes .

Étapes suivantes

Ce tutoriel a passé en revue le regroupement de fichiers source dans une recette, étape préalable à l’importation d’une recette dans Data Science Workspace. Vous devez maintenant avoir une image Docker dans le Registre de Conteneur Azure avec l'URL d'image correspondante. You are now ready to begin the tutorial on importing a packaged recipe into Data Science Workspace. Sélectionnez l’un des liens du tutoriel ci-dessous pour commencer: