Show Menu
主题×

导入打包的菜谱(UI)

本教程通过提供的零售销售示例提供有关如何配置和导入打包菜谱的分析。 在本教程结束时,您将准备好在Adobe Experience Platform Data Science Workspace中创建、培训和评估模型。

先决条件

本教程需要以Docker图像URL形式打包的菜谱。 有关详细信息,请参 阅有关如何将源文件打包到 “菜谱”的教程。

UI工作流程

将打包的菜谱导入Data Science Workspace需要特定菜谱配置,并编译为单个JavaScript对象表示法(JSON)文件,此菜谱配置编译称为配 置文件 。 具有特定配置集的打包菜谱称为菜 谱实例 。 一个菜谱可用于在数据科学工作区中创建多个菜谱实例。
导入包菜谱的工作流包含以下步骤:

配置菜谱

数据科学工作区中的每个菜谱实例都附带一组配置,这些配置可根据特定用例定制菜谱实例。 配置文件定义使用此菜谱实例创建的模型的默认培训和评分行为。
配置文件是特定于菜谱和大小写的。
以下是显示零售销售菜谱的默认培训和评分行为的示例配置文件。
[
    {
        "name": "train",
        "parameters": [
            {
                "key": "learning_rate",
                "value": "0.1"  
            },
            {
                "key": "n_estimators",
                "value": "100"
            },
            {
                "key": "max_depth",
                "value": "3"
            },
            {
                "key": "ACP_DSW_INPUT_FEATURES",
                "value": "date,store,storeType,storeSize,temperature,regionalFuelPrice,markdown,cpi,unemployment,isHoliday"
            },
            {
                "key": "ACP_DSW_TARGET_FEATURES",
                "value": "weeklySales"
            },
            {
                "key": "ACP_DSW_FEATURE_UPDATE_SUPPORT",
                "value": false
            },
            {
                "key": "tenantId",
                "value": "_{TENANT_ID}"
            },
            {
                "key": "ACP_DSW_TRAINING_XDM_SCHEMA",
                "value": "{SEE BELOW FOR DETAILS}"
            },
            {
                "key": "evaluation.labelColumn",
                "value": "weeklySalesAhead"
            },
            {
                "key": "evaluation.metrics",
                "value": "MAPE,MAE,RMSE,MASE"
            }
        ]
    },
    {
        "name": "score",
        "parameters": [
            {
                "key": "tenantId",
                "value": "_{TENANT_ID}"
            },
            {
                "key":"ACP_DSW_SCORING_RESULTS_XDM_SCHEMA",
                "value":"{SEE BELOW FOR DETAILS}"
            }
        ]
    }
]

参数键
类型
描述
learning_rate
数值
渐变乘法的标量。
n_estimators
数值
随机森林分类器的林中树数。
max_depth
数值
随机森林分类器中树的最大深度。
ACP_DSW_INPUT_FEATURES
字符串
列表以逗号分隔的输入模式属性。
ACP_DSW_TARGET_FEATURES
字符串
列表以逗号分隔的输出模式属性。
ACP_DSW_FEATURE_UPDATE_SUPPORT
布尔值
确定输入和输出功能是否可修改
tenantId
字符串
此ID可确保您创建的资源命名正确且包含在IMS组织中。 按照此处的步骤 ,查找您的租户ID。
ACP_DSW_TRAINING_XDM_SCHEMA
字符串
用于培训模型的输入模式。 在UI中导入时将此留空,在使用API导入时替换为培训架构ID。
evaluation.labelColumn
字符串
用于评估可视化的列标签。
evaluation.metrics
字符串
用于评估模型的评估指标的逗号分隔列表。
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA
字符串
用于对模型进行评分的输出模式。 在UI中导入时将此留空,在使用API导入时替换为评分SchemaID。
在本教程中,您可以保留数据科学工作区参考中零售销售菜谱的默认配置文件。

导入基于Docker的菜谱- Python

开始,方 是导航并选择位于平台UI左上角的工作流。 然后,选择“ 导入菜谱 ”并单 击启动
此时 将显示 “导入菜 谱”工作流 的“配置”页。 输入菜谱的名称和说明,然后 选择 右上角的下一步。
在将源 文件打包到菜谱教程中 ,在使用Python源文件构建零售销售菜谱结束时提供了一个Docker URL。
在“选择源”页 面上 ,在“源URL”字段中粘贴与使用Python源文件构建的打包菜谱对应的 Docker URL 。 然后,通过拖放导入提供的配置文件,或使用文件系统浏 览器 。 可在上找到提供的配置文件 experience-platform-dsw-reference/recipes/python/retail/retail.config.json 。 在“ 运行时 ”下拉 框中选 择Python ,在“类 ”下拉框中选 择“分类”。 填写完所有内容后,单 右上角的“下一步”,继续 管理模式
*类型​*支持​ 分类 ​和​ 回归 。 如果模型不属于这些类型之一,请选择“自定​ 义”
接下来,在“管理模式”部分下选择“零售销售”输 入和输出模式 ,这些是使用创建零售销售模式和数据集教程中 提供的引导脚本创建的
在“功 能管理 ”部分下,在模式查看器中单击租户标识以展开“零售销售”输入模式。 通过突出显示所需的功能并在右侧的“字段属性”窗口中选 择“输入功 能”或“ 目标功能 ”,选 择输入和输出功能。 在本教程中,将weeklySales 设置 “目标 功能”,将其他 设置为“输 入功能” 。 单击 下一 步以查看您新配置的菜谱。
根据需要审核菜谱、添加、修改或删除配置。 单击 完成 ,以创建菜谱。
继续执行 后续步骤 ,了解如何使用新创建的零售销售菜谱在数据科学工作区中创建模型。

导入基于Docker的菜谱- R

开始,方 是导航并选择位于平台UI左上角的工作流。 然后,选择“ 导入菜谱 ”并单 击启动
此时 将显示 “导入菜 谱”工作流 的“配置”页。 输入菜谱的名称和说明,然后 选择 右上角的下一步。
在将源 文件打包到菜谱教程中 ,在构建使用R源文件的零售销售菜谱结束时提供了Docker URL。
在“选择源”页 面上 ,请在“源URL”字段中粘贴与使用R源文件构建的打包菜谱对应的 Docker URL 。 然后,通过拖放导入提供的配置文件,或使用文件系统浏 览器 。 可在上找到提供的配置文件 experience-platform-dsw-reference/recipes/R/Retail\ -\ GradientBoosting/retail.config.json 。 在“ 运行时 ”下拉 框中选 择R,在“类 型”下 拉框中选 择“分类”。 填写完所有内容后,单​ 击** 右上角的“下一步”,继续 管理模式
*类型​*支持​ 分类 ​和​ 回归 。 如果模型不属于这些类型之一,请选择“自定​ 义”
接下来,在“管理模式”部分下选择“零售销售”输 入和输出模式 ,这些是使用创建零售销售模式和数据集教程中 提供的引导脚本创建的
在“功 能管理 ”部分下,在模式查看器中单击租户标识以展开“零售销售”输入模式。 通过突出显示所需的功能并在右侧的“字段属性”窗口中选 择“输入功 能”或“ 目标功能 ”,选 择输入和输出功能。 在本教程中,将weeklySales 设置 “目标 功能”,将其他 设置为“输 入功能” 。 单击 下一 步以查看您的新配置菜谱。
根据需要审核菜谱、添加、修改或删除配置。 单击 完成 ,以创建菜谱。
继续执行 后续步骤 ,了解如何使用新创建的零售销售菜谱在数据科学工作区中创建模型。

导入基于Docker的菜谱- PySpark

开始,方 是导航并选择位于平台UI左上角的工作流。 然后,选择“ 导入菜谱 ”并单 击启动
此时 将显示 “导入菜 谱”工作流 的“配置”页。 输入菜谱的名称和说明,然后 选择 右上角的下一步以继续。
在将源 文件打包到菜谱教程中 ,使用PySpark源文件在构建零售销售菜谱时提供了一个Docker URL。
在“选择源”页 面上 ,请在“源URL”字段中粘贴与使用PySpark源文件构建的打包菜谱对应的 Docker URL 。 然后,通过拖放导入提供的配置文件,或使用文件系统浏 览器 。 可在上找到提供的配置文件 experience-platform-dsw-reference/recipes/pyspark/retail/pipeline.json 。 在“ 运行时 ”下拉 框中选 择PySpark。 选择PySpark运行时后,默认工件会自动填充 到Docker 。 接下来,在 类型 下拉 框中选 择分类。 填写完所有内容后,单 右上角的“下一步”,继续 管理模式
*类型​*支持​ 分类 ​和​ 回归 。 如果模型不属于这些类型之一,请选择“自定​ 义”
接下来,在“管理模式”部分下选择“零售销售”输 入和输出模式 ,这些是使用创建零售销售模式和数据集教程中 提供的引导脚本创建的
在“功 能管理 ”部分下,在模式查看器中单击租户标识以展开“零售销售”输入模式。 通过突出显示所需的功能并在右侧的“字段属性”窗口中选 择“输入功 能”或“ 目标功能 ”,选 择输入和输出功能。 在本教程中,将weeklySales 设置 “目标 功能”,将其他 设置为“输 入功能” 。 单击 下一 步以查看您新配置的菜谱。
根据需要审核菜谱、添加、修改或删除配置。 单击 完成 ,以创建菜谱。
继续执行 后续步骤 ,了解如何使用新创建的零售销售菜谱在数据科学工作区中创建模型。

导入基于Docker的菜谱- Scala

开始,方 是导航并选择位于平台UI左上角的工作流。 然后,选择“ 导入菜谱 ”并单 击启动
此时 将显示 “导入菜 谱”工作流 的“配置”页。 输入菜谱的名称和说明,然后 选择 右上角的下一步以继续。
在将源 文件打包到菜谱教程中 ,在使用Scala(Spark)源文件构建零售销售菜谱结束时,会提供一个Docker URL。
在“选择源”页 面上 ,粘贴与使用“源URL”字段中的“缩放源文件”生成的打包菜谱对应的 Docker URL 。 然后,通过拖放导入提供的配置文件,或使用文件系统浏 览器 。 可在上找到提供的配置文件 experience-platform-dsw-reference/recipes/scala/retail/pipelineservice.json 。 在“ 运行时 ”下拉 框中选 择“Spark”。 选择Spark运行时后,默认工件会自动填充 到Docker 。 然后,从“ 类型 ”下 拉框中 选择“回归”。 填写完所有内容后,单 右上角的“下一步”,继续 管理模式
*类型​*支持​ 分类 ​和​ 回归 。 如果模型不属于这些类型之一,请选择“自定​ 义”
接下来,在“管理模式”部分下选择“零售销售”输 入和输出模式 ,这些是使用创建零售销售模式和数据集教程中 提供的引导脚本创建的
在“功 能管理 ”部分下,在模式查看器中单击租户标识以展开“零售销售”输入模式。 通过突出显示所需的功能并在右侧的“字段属性”窗口中选 择“输入功 能”或“ 目标功能 ”,选 择输入和输出功能。 在本教程中,将weeklySales 设置 “目标 功能”,将其他 设置为“输 入功能” 。 单击 下一 步以查看您新配置的菜谱。
根据需要审核菜谱、添加、修改或删除配置。 单击 完成 ,以创建菜谱。
继续执行 后续步骤 ,了解如何使用新创建的零售销售菜谱在数据科学工作区中创建模型。

后续步骤

本教程提供了有关配置菜谱并将其导入到数据科学工作区的见解。 您现在可以使用新创建的菜谱创建、培训和评估模型。