文档 Experience Platform Data Science Workspace 指南

将源文件打包到方法中

Last update: Thu May 25 2023 00:00:00 GMT+0000 (Coordinated Universal Time)

主题：
Data Science Workspace

创建对象：

User
Developer

本教程介绍了如何将提供的零售业示例源文件打包到一个存档文件中，该文件可用于在Adobe Experience Platform中创建方法 Data Science Workspace 通过在UI中或使用API遵循方法导入工作流。

要了解的概念：

配方：方法是Adobe对模型规范的术语，是一个顶级容器，表示构建和执行经过训练的模型并因此帮助解决特定业务问题所需的特定机器学习、人工智能算法或算法组合、处理逻辑和配置。
源文件：项目中包含方法逻辑的单个文件。

先决条件

方法创建

方法创建从打包源文件开始，以构建存档文件。源文件定义用于解决手头特定问题的机器学习逻辑和算法，并且用以下任一语言编写 Python、 R 、 PySpark或Scala。构建存档文件采用Docker映像的形式。构建后，打包的存档文件将导入到 Data Science Workspace 创建方法在UI中或使用API.

基于Docker的模型编写 docker-based-model-authoring

利用Docker图像，开发人员可将应用程序与所需的所有部分（如库和其他依赖项）打包在一起，然后作为一个包将其送出。

使用在方法创建工作流期间提供给您的凭据，将构建的Docker图像推送到Azure容器注册表。

要获取Azure容器注册表凭据，请登录 Adobe Experience Platform. 在左侧导航列中，导航到 工作流. 选择 导入方法 ，然后选择 Launch. 请参阅下面的屏幕快照以供参考。

此配置页面打开。提供适当的 方法名称，例如“零售指导方针”，并可选择提供描述或文档URL。完成后，单击 下一个.

选择适当的 运行时，然后选择分类对象类型. 完成后，将生成Azure Container Registry凭据。

NOTE

类型是机器学习问题的类别，方法是为其设计的，并在训练后用于帮助定制评估训练运行。

TIP

对象 Python 方法选择 Python 运行时。
对于R配方，选择 R 运行时。
对于PySpark配方，选择 PySpark 运行时。工件类型会自动填充。
对于Scala配方，选择 Spark 运行时。工件类型会自动填充。

记下Docker主机、用户名和密码的值。这些组件用于构建和推送 Docker 下面概述的工作流中的图像。

NOTE

完成下面列出的步骤后，将提供源URL。有关配置文件的说明，请参见中的后续教程后续步骤.

打包源文件

首先，获取 Experience Platform数据科学工作区参考存储库。

构建Python Docker图像
构建R Docker图像
构建PySpark Docker图像
构建Scala (Spark) Docker图像

生成 Python Docker图像 python-docker

如果您尚未这样做，请克隆 GitHub 使用以下命令将存储库安装到本地系统：

git clone https://github.com/adobe/experience-platform-dsw-reference.git

导航到目录 experience-platform-dsw-reference/recipes/python/retail. 在此，您将找到脚本 login.sh 和 build.sh 用于登录Docker并构建 Python Docker 图像。如果您的 Docker凭据就绪，按顺序输入以下命令：

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh

请注意，执行登录脚本时，您需要提供Docker主机、用户名和密码。构建时，您需要为构建提供Docker主机和版本标记。

构建脚本完成后，控制台输出中为您提供了Docker源文件URL。对于此特定示例，它类似于：

# URL format:
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}

复制此URL并转到后续步骤.

版本R Docker 图像 r-docker

如果您尚未这样做，请克隆 GitHub 使用以下命令将存储库安装到本地系统：

git clone https://github.com/adobe/experience-platform-dsw-reference.git

导航到目录 experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting 在克隆的存储库中。在此，您将找到文件 login.sh 和 build.sh ，用于登录Docker和构建R Docker映像。如果您的 Docker凭据就绪，按顺序输入以下命令：

# for logging in to Docker
./login.sh

# for build Docker image
./build.sh

请注意，执行登录脚本时，您需要提供Docker主机、用户名和密码。构建时，您需要为构建提供Docker主机和版本标记。

构建脚本完成后，控制台输出中为您提供了Docker源文件URL。对于此特定示例，它类似于：

# URL format:
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}

复制此URL并转到后续步骤.

构建PySpark Docker图像 pyspark-docker

首先克隆 GitHub 使用以下命令将存储库安装到本地系统：

git clone https://github.com/adobe/experience-platform-dsw-reference.git

导航到目录 experience-platform-dsw-reference/recipes/pyspark/retail. 脚本 login.sh 和 build.sh 位于此处，用于登录Docker和构建Docker映像。如果您的 Docker凭据就绪，按顺序输入以下命令：

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh

请注意，执行登录脚本时，您需要提供Docker主机、用户名和密码。构建时，您需要为构建提供Docker主机和版本标记。

构建脚本完成后，控制台输出中为您提供了Docker源文件URL。对于此特定示例，它类似于：

# URL format:
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}

复制此URL并转到后续步骤.

构建Scala Docker图像 scala-docker

首先克隆 GitHub 使用“终端”中的以下命令将存储库安装到本地系统中：

git clone https://github.com/adobe/experience-platform-dsw-reference.git

接下来，导航到目录 experience-platform-dsw-reference/recipes/scala 您可以在其中找到脚本 login.sh 和 build.sh. 这些脚本用于登录到Docker并构建Docker映像。如果您的 Docker凭据就绪，请依次向终端输入以下命令：

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh

TIP

如果您在尝试使用登录Docker时遇到权限错误 login.sh 脚本，尝试使用命令 bash login.sh.

执行登录脚本时，您需要提供Docker主机、用户名和密码。构建时，您需要为构建提供Docker主机和版本标记。

构建脚本完成后，控制台输出中为您提供了Docker源文件URL。对于此特定示例，它类似于：

# URL format:
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}

复制此URL并转到后续步骤.

后续步骤 next-steps

本教程介绍了如何将源文件打包到方法中，这是将方法导入到的先决条件步骤 Data Science Workspace. 现在，Azure Container Registry中应该有一个Docker图像以及相应的图像URL。现在，您可以开始教程，了解如何将打包的配方导入 Data Science Workspace. 选择以下教程链接之一开始：

recommendation-more-help

cc79fe26-64da-411e-a6b9-5b650f53e4e9