Show Menu
主题×

创建和发布机器学习模型演练

假装您拥有在线零售网站。 当您的客户在您的零售网站购物时,您希望向他们展示个性化的产品推荐,以展示您的业务优惠的各种其他产品。 在网站的存在期间,您不断收集客户数据,并希望以某种方式使用这些数据生成个性化的产品推荐。
Adobe Experience Platform Data Science Workspace提供了使用预建产品推荐菜谱实现目标 的方法 。 按照本教程,了解如何访问和了解您的零售数据、创建和优化机器学习模型以及在数据科学工作区中生成洞察。
本教程介绍了数据科学工作区的工作流程,并介绍了创建机器学习模型的以下步骤:

入门指南

在开始本教程之前,您必须具备以下先决条件:
  • 访问Adobe Experience Platform。 如果您无权访问Experience Platform中的IMS组织,请在继续操作之前与系统管理员联系。
  • Enablement assets。 请联系您的客户代表,为您提供以下项目。
    • 推荐方法
    • Recommendations输入数据集
    • 推荐输入模式
    • Recommendations输出数据集
    • 推荐输出模式
    • 黄金数据集postValues
    • 黄金数据集模式
  • Notebooks-ThursAdobe公共Git存储库下载三个必需的Jupyter Notebook文件,这些文件将用于演示Data Science Workspace中的JupyterLab工作流程。
  • 对本教程中使用的以下主要概念的了解:
    • 体验数据模型 :Adobe领导的标准化工作为客户体验管理定义了标准模式,如用户档案和ExperienceEvent。
    • 数据集:实际数据的存储和管理结构。 XDM模式的物理实例化实例
    • 批:数据集由批量组成。 批是在一段时间内收集并作为单个单元一起处理的一组数据。
    • JupyterLab:JupyterLab jupyterlab-is-ready-for-users-5a6f039b8906 是Project Jupyter的一个基于Web的开放源代码界面,它紧密集成到Experience Platform中。

准备数据

要创建可向客户推荐个性化产品的机器学习模型,必须分析您网站上先前的客户购买情况。 本节探讨如何通过Adobe Analytics将这些数据引入平台,以及如何将这些数据转换为功能数据集以供机器学习模型使用。

浏览数据并了解模式

  1. 登录到 Adobe Experience Platform ,单击“数据集 ​”以列表所有现有数据集并选择要浏览的数据集。 在这种情况下,Analytics数据集 Golden Data Set postValues
  2. 选择 右上角附近的预览数据集 ,以检查示例记录,然后单击 关闭
  3. 选择右边栏中模式下的链接以视图数据集的模式,然后返回数据集详细信息页面。”
其他数据集已预填充了批量,以用于预览。 您可以重复上述步骤来视图这些数据集。
数据集名称
模式
描述
黄金数据集postValues
黄金数据集模式
从您的网站分析源数据
Recommendations输入数据集
推荐输入模式
Analytics数据会使用功能管道转换为培训数据集。 此数据用于培训Product Recommendations机器学习模型。 itemid 与该 userid 客户购买的产品相对应。
Recommendations输出数据集
推荐输出模式
存储了评分结果的数据集,其中将包含每个客户推荐产品的列表。

创作模型

数据科学工作区生命周期的第二个组件涉及创作方法和模型。 产品推荐菜谱旨在通过利用过去的购买数据和机器学习大规模生成产品推荐。
菜谱是模型的基础,因为它们包含机器学习算法和用于解决特定问题的逻辑。 更重要的是,“方法”使您能够在整个组织内实现机器学习大众化,使其他用户能够访问针对不同使用案例的模型,而无需编写任何代码。

浏览产品推荐菜谱

  1. 在Adobe Experience Platform中,从左侧导航列导 航到 “模型”,然后单击顶部的菜谱,为您的组织视图一列表可用的菜谱。
  2. 单击提供的推荐菜 谱名称 ,找到并打开它。
  3. 在右侧边栏中,单击“推荐输 入模式” ,以视图为菜谱提供动力的模式。 模式字 段itemId userId与客户在特定时间(timestampTiment )购买的产品( interactionType )相对应。 按照相同的步骤查看“推荐输出” 模式的字段
您现在已复查了产品推荐方法所需的输入和输出模式。 您现在可以继续阅读下一节,了解如何创建、培训和评估产品推荐模型。

培训和评估您的模型

现在您的数据已准备好并且菜谱已准备好使用,您可以创建、培训和评估您的机器学习模型。

创建模型

“模型”是“菜谱”的实例,使您能够大规模地对数据进行培训和评分。
  1. 在Adobe Experience Platform中,从左侧导航列导航到 Models ,然后单击页面顶部的 Recipes ,以显示组织的所有可用Recipes的列表。
  2. 通过单击提供的“ 推荐菜谱 ”名称,然后输入“菜谱”的概述页面,查找并打开提供的“推荐菜谱”。 单 ​击中心(如果没有现有模型)或处方概述页面右上方的创建模型。
  3. 此时将显示用于培训的可用输入数据集列表,选择 Recommendations输入数据集 ,然后单击 下一步
  4. 为模型提供名称,例如“产品推荐模型”。 此时会列出模型的可用配置,其中包含模型的默认培训和评分行为的设置。 由于这些配置特定于您的组织,因此无需进行任何更改。 查看配置,然后单击“完 成”
  5. 模型现已创建完毕,模型的“概述”( Overview )页面将显示在新生成的培训运行中。 默认情况下,创建模型时会生成培训运行。
您可以选择等待培训运行完成,或在下一节中继续创建新的培训运行。

使用自定义超参数训练模型

  1. 在“模 型概述 ”(Model Overview )页面上,单击右上 角附近的“培训”(Train)以创建新的培训运行。 选择创建“模型”时使用的相同输入数据集,然后单击“下 一步”
  2. 此时将 显示 “配置”页。 您可以在此配置培训运行的 num_recommendations 值,也称为超级参数。 经过训练和优化的模型将根据训练运行的结果使用性能最佳的超参数。
    无法学习超参数,因此必须在进行培训之前分配超参数。 调整超参数可能会改变训练模型的精度。 由于优化模型是一个迭代过程,因此在达到满意的评估之前可能需要多次培训运行。
    num_recommendations 设置为10。
  3. 新培训运行完成后,模型评估图表上将显示一个额外的数据点,最长可能需要几分钟。

评估模型

每次培训运行完成时,您都可以视图所得的评估指标,以确定模型的表现。
  1. 通过单击培训运行查看每个已完成培训运行的评估指标(精确度和召回率)。
  2. 浏览为每个评估指标提供的信息。 这些指标越高,模型的表现越好。
  3. 您可以在右侧边栏上查看用于每个培训运行的数据集、模式和配置参数。
  4. 导航回“模型”页面,通过观察其评估指标确定运行效果最佳的培训。

操作模型

数据科学工作流程的最后一步是操作模型,以便从数据存储中得分和使用洞察。

得分和生成洞察

  1. 在产品推荐模型概 述页面 ,单击性能最佳的培训运行的名称,其调用率和精度值最高。
  2. 在培训运行详细信息页面的右上角,单击“得分
  3. 选择 Recommendations输入数据集作为评分输入数据集 ,该数据集与您创建模型并执行其培训运行时使用的数据集相同。 然后,单击“下 一步 ”。
  4. 选择Recommendations 输出数据集 ,作为评分输出数据集。 评分结果将作为批量存储在此数据集中。
  5. 查看评分配置。 这些参数包含以前选择的输入和输出数据集以及相应的模式。 单击 完成 ,开始评分运行。 运行可能需要几分钟才能完成。

视图的洞察

成功完成评分运行后,您将能够预览结果并视图生成的洞察。
  1. 在评分运行页面上,单击已完成的评分运行,然后单击右边 栏上的预览评分结果数据集
  2. 在预览表中,每行都包含特定客户的产品推荐,分别标记为 推荐 userId 。 由于 num_recommendations Hyperparameter在示例屏幕截图中设置为10,因此每行推荐最多可包含10个产品标识,用数字符号(#)分隔。
做得好,您已成功生成产品推荐!
本教程向您介绍了数据科学工作区的工作流程,演示如何通过机器学习将未经处理的原始数据转换为有用的信息。 要进一步了解如何使用Data Science Workspace,请继续阅读有关创建零售销 售模式和数据集的下一个指南