Show Menu
主题×

将源文件打包到菜谱中

本教程提供有关如何将提供的零售销售示例源文件打包到存档文件中的说明,该存档文件可用于通过在UI中或使用API遵循菜谱导入工作流在Adobe Experience Platform Data Science Workspace中创建菜谱。
要了解的概念:
  • 菜谱 : 处方是Adobe的“模型”规范术语,是代表特定机器学习、人工智能算法或算法集成、处理逻辑和配置的顶级容器,构建和执行经过培训的模型,从而帮助解决特定的业务问题。
  • 源文件 : 项目中包含菜谱逻辑的各个文件。

菜谱创建

菜谱创建开始与打包源文件一起构建存档文件。 源文件定义了用于解决现有特定问题的机器学习逻辑和算法,并以Python、R、PySpark或Scala编写。 构建的存档文件采用Docker图像的形式。 构建后,打包的存档文件将导入到Data Science Workspace中,以在UI 中或使用 API 创建菜谱

基于Docker的模型创作

Docker图像允许开发人员将应用程序与其所需的所有部件(如库和其他依赖项)打包,并将其作为一个包发布。
内置的Docker图像将使用在菜谱创建工作流程中提供给您的凭据推送到Azure容器注册表。
要获取您的Azure容器注册表凭据,请登 platform.adobe.com 录Adobe Experience Platform。 在左侧导航列中,导航到 工作流 。 选择 导入菜谱 ,然后选择 启动 。 请参阅下面的屏幕快照。
此时将 打开 “配置”页。 提供适当 的处方名 (例如“零售销售处方”),并(可选)提供说明或文档URL。 完成后,单击“下 一步 ”。
选择适当的 运行时 ,然后选择类 型的 “分 类” 。 完成后,将生成您的Azure容器注册表凭据。
类型​ ,是机器学习问题的类,它是为菜谱设计的,经过培训后,用来帮助定制对培训运行的评估。
  • 对于Python菜谱,选择 Python runtime。
  • 对于R菜谱,请选 R运行时。
  • 对于PySpark菜谱,请选 择PySpark 运行时。 自动填充对象类型。
  • 对于Scala菜谱,请选择 Spark runtime。 自动填充对象类型。
请注意Docker主 *机、* 用户名 ​和密 码值 。 它们用于在下面概述的工作流中构建和推送Docker图像。
完成以下步骤后,将提供源URL。 配置文件将在后续步骤中的后续教程中 进行说明

打包源文件

开始,获取Experience Platform Data Science Workspace参 experience-platform-dsw-reference 考存储库中的示例代码库 。

构建Python Docker图像

如果尚未这样做,请使用以下命令将github存储库克隆到本地系统上:
git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigate to the directory experience-platform-dsw-reference/recipes/python/retail . 在此,您将找到用于登 login.sh build.sh Docker和构建python Docker图像的脚本。 如果您的Docker凭 据已准备 ,请按顺序输入以下命令:
# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

请注意,执行登录脚本时,您需要提供Docker主机、用户名和密码。 在构建时,您需要提供Docker主机和版本标记。
构建脚本完成后,控制台输出中将为您提供一个Docker源文件URL。 对于此特定示例,其外观类似于:
# URL format: 
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}

复制此URL并转到下 一步

构建R Docker图像

如果尚未这样做,请使用以下命令将github存储库克隆到本地系统上:
git clone https://github.com/adobe/experience-platform-dsw-reference.git

导览至克隆存储 experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting 库中的目录。 在此,您将找到用 login.sh build.sh 登录Docker和构建R Docker图像的文件。 如果您的Docker凭 据已准备 ,请按顺序输入以下命令:
# for logging in to Docker
./login.sh
 
# for build Docker image
./build.sh

请注意,执行登录脚本时,您需要提供Docker主机、用户名和密码。 在构建时,您需要提供Docker主机和版本标记。
构建脚本完成后,控制台输出中将为您提供一个Docker源文件URL。 对于此特定示例,其外观类似于:
# URL format: 
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}

复制此URL并转到下 一步

构建PySpark Docker图像

开始,使用以下命令将github存储库克隆到本地系统上:
git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigate to the directory experience-platform-dsw-reference/recipes/pyspark/retail . 脚本 login.sh 和位 build.sh 于此处,用于登录Docker和构建Docker图像。 如果您的Docker凭 据已准备 ,请按顺序输入以下命令:
# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

请注意,执行登录脚本时,您需要提供Docker主机、用户名和密码。 在构建时,您需要提供Docker主机和版本标记。
构建脚本完成后,控制台输出中将为您提供一个Docker源文件URL。 对于此特定示例,其外观类似于:
# URL format: 
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}

复制此URL并转到下 一步

构建Scala Docker图像

开始,使用终端中的以下命令将github存储库克隆到本地系统上:
git clone https://github.com/adobe/experience-platform-dsw-reference.git

接下来,导航到可 experience-platform-dsw-reference/recipes/scala/retail 以找到脚本和的目 login.sh build.sh 。 这些脚本用于登录Docker并构建Docker图像。 如果您的Docker凭 据已准备 ,请按顺序将以下命令输入终端:
# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

执行登录脚本时,您需要提供Docker主机、用户名和密码。 在构建时,您需要提供Docker主机和版本标记。
构建脚本完成后,控制台输出中将为您提供一个Docker源文件URL。 对于此特定示例,其外观类似于:
# URL format: 
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}

复制此URL并转到下 一步

后续步骤

本教程重点介绍将源文件打包到“菜谱”(将“菜谱”导入“数据科学工作区”的先决条件)。 您现在应在Azure容器注册表中拥有Docker图像以及相应的图像URL。 您现在可以开始将打包菜谱导入数据科学工作区的教程。 选择以下教程链接之一以开始: