Show Menu
主题×

创建并发布机器学习模型演练

假装您拥有在线零售网站。 当您的客户在您的零售网站上购物时,您希望向他们提供个性化的产品建议,以展示您的业务优惠的各种其他产品。 在您网站的存在期间,您不断收集客户数据,并希望以某种方式利用这些数据生成个性化的产品推荐。
Adobe Experience Platform Data Science Workspace 借助预建的产品Recommendations菜谱,提供实现您 目标的方法 。 请按照本教程,了解如何访问和了解您的零售数据、创建和优化机器学习模型以及在中生成洞察 Data Science Workspace。
本教程反映了机器学习 Data Science Workspace模型的工作流程,并涵盖创建机器学习模型的以下步骤:

入门指南

在开始本教程之前,您必须具有以下先决条件:
  • 访问 Adobe Experience Platform。 如果您无权访问中的IMS组织,请在继 Experience Platform续操作之前与系统管理员联系。
  • Enablement Assets。 请联系您的客户代表,为您提供以下项目。
    • Recommendations菜谱
    • Recommendations输入数据集
    • Recommendations输入模式
    • Recommendations输出数据集
    • Recommendations产出模式
    • 黄金数据集postValues
    • 黄金数据集模式
  • 从Adobe公 Jupyter Notebook 共资料 库下 Git 载三个必需 的 JupyterLab 文件 Data Science Workspace,这些文件将用于演示中的工作流程。
  • 对本教程中使用的下列主要概念的有效理解:
    • 体验数据模型 :由Adobe领导的标准化工作,为客户体验管理定 Profile 义标准模式,如ExperienceEvent。
    • 数据集:实际数据的存储和管理结构。 XDM模式的物理实例 化实例
    • 批:数据集由批量组成。 批是在一段时间内收集的一组数据,并作为单个单元一起处理。
    • JupyterLab: JupyterLab是 一个基于Web的开放源代码界面, Jupyter 它紧密集成在Project中 Experience Platform。

准备数据

要创建能够向客户提供个性化产品建议的机器学习模型,必须分析您网站上先前的客户购买情况。 本节探讨如何将这些数据引入 Platform 到 Adobe Analytics其中,以及如何将这些数据转换为要由机器学习模型使用的特征数据集。

浏览数据并了解模式

  1. 登录到 Adobe Experience Platform ,单击“ 数据集 ”列表所有现有数据集并选择要浏览的数据集。 在这种情况下,数 Analytics 据 集Golden Data Set postValues
  2. 选择 右上方 的预览数据集以检查示例记录,然后单击 关闭
  3. 选择右边栏中模式下的链接以视图数据集的模式,然后返回数据集详细信息页面。”
其他数据集已预先填充了批,以便进行预览。 您可以重复上述步骤来视图这些数据集。
数据集名称
架构
描述
黄金数据集postValues
黄金数据集模式
Analytics 您网站的源数据
Recommendations输入数据集
Recommendations输入模式
使用 Analytics 特征管道将数据转换为培训数据集。 此数据用于培训产品Recommendations机器学习模型。 itemid 与该 userid 客户所购买的产品相对应。
Recommendations输出数据集
Recommendations产出模式
存储了评分结果的数据集,它将包含每个客户推荐产品的列表。

创作模型

生命周期的第二个组 Data Science Workspace 件涉及创作菜谱和模型。 产品Recommendations处方旨在通过利用过去的购买数据和机器学习大规模生成产品推荐。
菜谱是模型的基础,因为它们包含机器学习算法和用于解决特定问题的逻辑。 更重要的是,菜谱使您能够在整个组织内实现机器学习的大众化,使其他用户能够访问针对不同用例的模型,而无需编写任何代码。

浏览产品Recommendations秘方

  1. 在中 Adobe Experience Platform,从左 侧导航列导航 到“模型”,然后单击顶 部的菜谱 ,以视图组织的一列表可用菜谱。
  2. 通过单击提供的 Recommendations菜谱 ,找到并打开它。
  3. 在右侧边栏中,单击“ Recommendations输入模式 ”以视图为菜谱加电的模式。 模式字 段itemId 和userId与客户在特定时间(timestamp ID)购买的产品( interactionType )相对应。 按照相同的步骤查看“Recommendations输出” 模式的字段
您现在已查看了“产品Recommendations处方”要求的输入和输出模式。 您现在可以继续阅读下一节,了解如何创建、培训和评估产品Recommendations模型。

培训和评估您的模型

现在您的数据已准备就绪,菜谱已经可供使用,您可以创建、培训和评估您的机器学习模型。

创建模型

模型是处方的一个实例,使您能够大规模地对数据进行培训和评分。
  1. 在中 Adobe Experience Platform,从左 侧导航列导航 到“模型”,然后单击页面顶 部的菜谱 ,以显示组织中所有可用菜谱的列表。
  2. 通过单击菜谱的 名称 ,输入菜谱的概述页面,找到并打开提供的Recommendations菜谱。 单 击中心 (如果没有现有模型)或从“处方概览”页的右上方创建模型。
  3. 将显示培训的可用输入数据集列表,选择“ Recommendations输入数据集 ”并单 击“下一步 ”。
  4. 提供模型的名称,例如“产品Recommendations模型”。 此时会列出模型的可用配置,其中包含模型的默认培训和评分行为的设置。 由于这些配置特定于您的组织,因此无需进行任何更改。 查看配置,然后单击 完成
  5. 模型现已创建,新生成的培训运行中 会显 示模型的“概述”页面。 默认情况下,创建模型时会生成培训运行。
您可以选择等待培训运行完成,或在下一节中继续创建新的培训运行。

使用自定义超参数训练模型

  1. 在“模 型概述 ”页上, 单击右 上方附近的“培训”以创建新的培训运行。 选择创建模型时使用的同一输入数据集,然后单击“下 一步”
  2. 此时将 显示 “配置”页。 您可以在此配置培训运行的 num_recommendations 值,也称为超级参数。 经过训练和优化的模型将根据训练结果使用性能最佳的超参数。
    无法学习超参数,因此必须在进行培训之前分配超参数。 调整超参数可能会改变训练模型的精度。 由于优化模型是一个迭代过程,因此在获得满意的评估之前可能需要多次培训运行。
    num_recommendations 设置为10。
  3. 新培训运行完成后,模型评估图表上将显示一个额外的数据点,这可能需要几分钟时间。

评估模型

每次培训运行完成时,您都可以视图生成的评估指标,以确定模型的执行情况。
  1. 单击培训运行,查看每个已完成培训运行的评估指标(精确度和召回率)。
  2. 浏览为每个评估指标提供的信息。 这些指标越高,模型执行得越好。
  3. 您可以在右侧边栏上查看用于每个培训运行的数据集、模式和配置参数。
  4. 导航回“模型”页,通过观察培训的评估指标确定运行效果最好的培训。

操作模型

数据科学工作流程的最后一步是操作模型,以便从数据存储中得分和使用洞察。

评分和生成洞察

  1. 在产品推荐模型 概述 页面上,单击性能最佳的培训运行的名称,其中具有最高的召回率和精确度值。
  2. 在培训运行详细信息页面的右上角,单击“得分
  3. 选择 Recommendations输入数据集 ,作为评分输入数据集,该数据集与您创建模型并执行其培训运行时使用的数据集相同。 然后,单击“下 一步 ”。
  4. 选择 Recommendations输出数据集 ,作为评分输出数据集。 评分结果将作为批处理存储在此数据集中。
  5. 查看评分配置。 这些参数包含先前选择的输入和输出数据集以及相应的模式。 单击 完成 ,开始评分运行。 运行可能需要几分钟才能完成。

视图洞察

评分运行成功完成后,您将能够预览结果并视图生成的洞察。
  1. 在评分运行页面上,单击已完成的评分运行,然后单击右边 栏上的预览评分结果 数据集。
  2. 在预览表中,每行都包含特定客户的产品推荐,分别标记为 推荐 和userId 。 由于 在示例屏幕截图中 ,num_recommendations Hyperparameter设置为10,因此每行推荐最多可包含10个产品标识,用数字符号(#)分隔。

后续步骤

做得好,您已成功生成产品推荐!
本教程向您介绍了如何通过机 Data Science Workspace器学习将未经处理的原始数据转换为有用信息。 要进一步了解如何使 Data Science Workspace用,请继续阅读下一 个指南,创建零售模式和数据集