Empaquetar archivos de origen en una fórmula

Este tutorial proporciona instrucciones sobre cómo puede empaquetar los archivos de origen de muestra de ventas minoristas proporcionados en un archivo, que se puede utilizar para crear una fórmula en Adobe Experience Platform Data Science Workspace siguiendo el flujo de trabajo de importación de fórmulas en la interfaz de usuario o utilizando la API.

Conceptos para comprender:

  • Fórmulas: una fórmula es el término que utiliza un Adobe para especificar un modelo y es un contenedor de nivel superior que representa un aprendizaje automático específico, un algoritmo de inteligencia artificial o un conjunto de algoritmos, una lógica de procesamiento y una configuración necesarios para crear y ejecutar un modelo entrenado y, por lo tanto, ayudar a solucionar problemas empresariales específicos.
  • Archivos de origen: archivos individuales del proyecto que contienen la lógica de una fórmula.

Requisitos previos

Creación de fórmula

La creación de la fórmula comienza con los archivos de origen de los paquetes para crear un archivo. Los archivos de origen definen la lógica de aprendizaje automático y los algoritmos utilizados para resolver un problema específico, y están escritos en Python, R, PySpark o Scala. Los archivos de almacenamiento creados toman la forma de una imagen Docker. Una vez creado, el archivo empaquetado se importa en Data Science Workspace para crear una fórmula en la IU de o uso de la API.

Creación de modelos basados en Docker docker-based-model-authoring

Una imagen Docker permite a un desarrollador empaquetar una aplicación con todas las partes que necesita, como bibliotecas y otras dependencias, y distribuirla como un paquete.

La imagen Docker creada se inserta en el Registro de contenedores de Azure con las credenciales proporcionadas durante el flujo de trabajo de creación de fórmulas.

Para obtener sus credenciales de Azure Container Registry, inicie sesión en Adobe Experience Platform. En la columna de navegación de la izquierda, navegue hasta Flujos de trabajo. Seleccionar Importar fórmula seguido de una selección Launch. Consulte la captura de pantalla siguiente como referencia.

El Configurar se abre la página. Proporcione un Nombre de fórmula, por ejemplo, "Fórmula de ventas minoristas" y, opcionalmente, proporcione una descripción o una URL de documentación. Una vez finalizado, haga clic en Siguiente.

Seleccione el adecuado Runtime y, a continuación, elija una Clasificación para Tipo. Las credenciales del Registro de contenedores de Azure se generan una vez completadas.

NOTE
Tipo es la clase de problema de aprendizaje automático para el que está diseñada la fórmula y se utiliza después del aprendizaje para ayudar a adaptar la evaluación de la ejecución del aprendizaje.
TIP
  • Para Python recetas seleccione la Python runtime.
  • Para recetas R, seleccione la R runtime.
  • Para las recetas PySpark seleccione la PySpark runtime. Se rellena automáticamente un tipo de artefacto.
  • Para recetas de Scala, seleccione la Spark runtime. Se rellena automáticamente un tipo de artefacto.

Tenga en cuenta los valores de host, nombre de usuario y contraseña de Docker. Se utilizan para crear y publicar su Docker en los flujos de trabajo descritos a continuación.

NOTE
La URL de origen se proporciona después de completar los pasos descritos a continuación. El archivo de configuración se explica en los tutoriales posteriores que se encuentran en pasos siguientes.

Empaquetar los archivos de origen

Comience obteniendo el código base de muestra que se encuentra en Referencia de Data Science Workspace de Experience Platform repositorio.

Generar Python Imagen de Docker python-docker

Si no lo ha hecho, clone el GitHub repositorio en el sistema local con el siguiente comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Vaya al directorio experience-platform-dsw-reference/recipes/python/retail. Aquí encontrará los scripts. login.sh y build.sh se utiliza para iniciar sesión en Docker y crear el Python Docker imagen. Si tiene su Credenciales de Docker listo, introduzca los siguientes comandos en orden:

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh

Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, debe proporcionar el host Docker y una etiqueta de versión para la compilación.

Una vez completado el script de generación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format:
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}

Copie esta dirección URL y continúe con la pasos siguientes.

Compilación R Docker imagen r-docker

Si no lo ha hecho, clone el GitHub repositorio en el sistema local con el siguiente comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Vaya al directorio experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting dentro del repositorio clonado. Aquí, encontrará los archivos. login.sh y build.sh que utilizará para iniciar sesión en Docker y crear la imagen de R Docker. Si tiene su Credenciales de Docker listo, introduzca los siguientes comandos en orden:

# for logging in to Docker
./login.sh

# for build Docker image
./build.sh

Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, debe proporcionar el host Docker y una etiqueta de versión para la compilación.

Una vez completado el script de generación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format:
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}

Copie esta dirección URL y continúe con la pasos siguientes.

Crear imagen PySpark Docker pyspark-docker

Comience por clonar el GitHub repositorio en el sistema local con el siguiente comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Vaya al directorio experience-platform-dsw-reference/recipes/pyspark/retail. Los scripts login.sh y build.sh se encuentran aquí y se utilizan para iniciar sesión en Docker y crear la imagen de Docker. Si tiene su Credenciales de Docker listo, introduzca los siguientes comandos en orden:

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh

Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, debe proporcionar el host Docker y una etiqueta de versión para la compilación.

Una vez completado el script de generación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format:
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}

Copie esta dirección URL y continúe con la pasos siguientes.

Crear imagen de Scala Docker scala-docker

Comience por clonar el GitHub repositorio en el sistema local con el siguiente comando en terminal:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

A continuación, vaya al directorio experience-platform-dsw-reference/recipes/scala donde puede encontrar los scripts login.sh y build.sh. Estos scripts se utilizan para iniciar sesión en Docker y crear la imagen de Docker. Si tiene su Credenciales de Docker listo, introduzca los siguientes comandos en el terminal en orden:

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh
TIP
Si recibe un error de permiso al intentar iniciar sesión en Docker con el login.sh script, intente utilizar el comando bash login.sh.

Al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, debe proporcionar el host Docker y una etiqueta de versión para la compilación.

Una vez completado el script de generación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format:
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}

Copie esta dirección URL y continúe con la pasos siguientes.

Pasos siguientes next-steps

Este tutorial trata sobre el empaquetado de archivos de origen en una fórmula, el paso previo para importar una fórmula en Data Science Workspace. Ahora debe tener una imagen Docker en el Registro de contenedores de Azure junto con la URL de imagen correspondiente. Ya está listo para comenzar el tutorial sobre la importación de una fórmula empaquetada en Data Science Workspace. Seleccione uno de los siguientes vínculos para empezar:

recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9