Show Menu
主题×

创建并发布机器学习模型演练

假装您拥有在线零售网站。 当您的客户在您的零售网站上购物时,您希望向他们提供个性化的产品建议,以展示您的业务优惠的各种其他产品。 在您网站的存在期间,您不断收集客户数据,并希望以某种方式利用这些数据生成个性化的产品推荐。
Adobe Experience Platform 数据科学工作区提供了使用预建产品推荐菜谱实现 目标的方法 。 按照本教程,了解如何访问和了解您的零售数据、创建和优化机器学习模型以及在数据科学工作区中生成洞察。
本教程介绍了数据科学工作区的工作流程,并涵盖了创建机器学习模型的以下步骤:

入门指南

在开始本教程之前,您必须具有以下先决条件:
  • 访问 Adobe Experience Platform。 如果您无权访问Experience Platform中的IMS组织,请在继续操作前与系统管理员联系。
  • Enablement Assets。 请联系您的客户代表,为您提供以下项目。
    • 推荐方法
    • Recommendations输入数据集
    • 建议输入模式
    • Recommendations输出数据集
    • 推荐输出模式
    • 黄金数据集postValues
    • 黄金数据集模式
  • 从Adobe公共Git存储库下载三个必 Notebooks-Thurs 需的Jupyter Notebook文件,这些文件将用于演示Data Science Workspace中的JupyterLab工作流程。
  • 对本教程中使用的下列主要概念的有效理解:
    • 体验数据模型 : 由Adobe领导的标准化工作,为客户体验管理定义标准模式,如用户档案和ExperienceEvent。
    • 数据集: 实际数据的存储和管理结构。 XDM模式的物理实例 化实例
    • 批: 数据集由批量组成。 批是在一段时间内收集的一组数据,并作为单个单元一起处理。
    • JupyterLab: JupyterLab是 Project Jupyter的一个基于Web的开放源代码界面,它紧密集成到Experience Platform中。

准备数据

要创建能够向客户提供个性化产品建议的机器学习模型,必须分析您网站上先前的客户购买情况。 本部分探讨如何通过将此数据引入平 Adobe Analytics台,以及如何将该数据转换为要由机器学习模型使用的特征数据集。

浏览数据并了解模式

  1. 登录Adobe Experience Platform ,单击 Dataset (数据集)以列表所有现有数据集并选择要浏览的数据集。 在这种情况下,Analytics数据集 Golden Data Set postValues
  2. 选择 右上方 的预览数据集以检查示例记录,然后单击 关闭
  3. 选择右边栏中模式下的链接以视图数据集的模式,然后返回数据集详细信息页面。”
其他数据集已预先填充了批,以便进行预览。 您可以重复上述步骤来视图这些数据集。
数据集名称
架构
描述
黄金数据集postValues
黄金数据集模式
分析网站的源数据
Recommendations输入数据集
建议输入模式
Analytics数据会使用功能管道转换为培训数据集。 此数据用于培训产品推荐机器学习模型。 itemid 与该 userid 客户所购买的产品相对应。
Recommendations输出数据集
推荐输出模式
存储了评分结果的数据集,它将包含每个客户推荐产品的列表。

创作模型

数据科学工作区生命周期的第二个组件涉及创作方法和模型。 产品推荐菜谱旨在通过利用过去的购买数据和机器学习大规模生成产品推荐。
菜谱是模型的基础,因为它们包含机器学习算法和用于解决特定问题的逻辑。 更重要的是,菜谱使您能够在整个组织内实现机器学习的大众化,使其他用户能够访问针对不同用例的模型,而无需编写任何代码。

浏览产品推荐菜谱

  1. 在中 Adobe Experience Platform,从左 侧导航列导航 到“模型”,然后单击顶 部的菜谱 ,以视图组织的一列表可用菜谱。
  2. 单击提供的推荐菜 谱名称 ,找到并打开它。
  3. 在右侧边栏中,单击“ 推荐输入模式 ”以视图为菜谱提供动力的模式。 模式字 段itemId 和userId与客户在特定时间(timestamp ID)购买的产品( interactionType )相对应。 按照相同的步骤查看“Recommendations Output(建议输出)” 模式的字段
您现在已审核了产品推荐方法所需的输入和输出模式。 您现在可以继续阅读下一节,了解如何创建、培训和评估产品推荐模型。

培训和评估您的模型

现在您的数据已准备就绪,菜谱已经可供使用,您可以创建、培训和评估您的机器学习模型。

创建模型

模型是处方的一个实例,使您能够大规模地对数据进行培训和评分。
  1. 在中 Adobe Experience Platform,从左 侧导航列导航 到“模型”,然后单击页面顶 部的菜谱 ,以显示组织中所有可用菜谱的列表。
  2. 通过单击处方名称 并输入 “处方”的概述页面,查找并打开提供的推荐处方。 单 击中心 (如果没有现有模型)或从“处方概览”页的右上方创建模型。
  3. 将显示培训的可用输入数据集的列表,选择“ Recommendations Input Dataset ”,然后单 击“Next ”。
  4. 为模型提供名称,例如“产品推荐模型”。 此时会列出模型的可用配置,其中包含模型的默认培训和评分行为的设置。 由于这些配置特定于您的组织,因此无需进行任何更改。 查看配置,然后单击 完成
  5. 模型现已创建,新生成的培训运行中 会显 示模型的“概述”页面。 默认情况下,创建模型时会生成培训运行。
您可以选择等待培训运行完成,或在下一节中继续创建新的培训运行。

使用自定义超参数训练模型

  1. 在“模 型概述 ”页上, 单击右 上方附近的“培训”以创建新的培训运行。 选择创建模型时使用的同一输入数据集,然后单击“下 一步”
  2. 此时将 显示 “配置”页。 您可以在此配置培训运行的 num_recommendations 值,也称为超级参数。 经过训练和优化的模型将根据训练结果使用性能最佳的超参数。
    无法学习超参数,因此必须在进行培训之前分配超参数。 调整超参数可能会改变训练模型的精度。 由于优化模型是一个迭代过程,因此在获得满意的评估之前可能需要多次培训运行。
    num_recommendations 设置为10。
  3. 新培训运行完成后,模型评估图表上将显示一个额外的数据点,这可能需要几分钟时间。

评估模型

每次培训运行完成时,您都可以视图生成的评估指标,以确定模型的执行情况。
  1. 单击培训运行,查看每个已完成培训运行的评估指标(精确度和召回率)。
  2. 浏览为每个评估指标提供的信息。 这些指标越高,模型执行得越好。
  3. 您可以在右侧边栏上查看用于每个培训运行的数据集、模式和配置参数。
  4. 导航回“模型”页,通过观察培训的评估指标确定运行效果最好的培训。

操作模型

数据科学工作流程的最后一步是操作模型,以便从数据存储中得分和使用洞察。

评分和生成洞察

  1. 在产品推荐模型 概述 页面上,单击性能最佳的培训运行的名称,其中具有最高的召回率和精确度值。
  2. 在培训运行详细信息页面的右上方,单击“得分
  3. 选择Recommendations 输入数据集 ,作为评分输入数据集,该数据集与您创建Model并执行其培训运行时使用的数据集相同。 然后,单击“下 一步 ”。
  4. 选择Recommendations 输出数据集 ,作为评分输出数据集。 评分结果将作为批处理存储在此数据集中。
  5. 查看评分配置。 这些参数包含先前选择的输入和输出数据集以及相应的模式。 单击 完成 ,开始评分运行。 运行可能需要几分钟才能完成。

视图洞察

评分运行成功完成后,您将能够预览结果并视图生成的洞察。
  1. 在评分运行页面上,单击已完成的评分运行,然后单击右边 栏上的预览评分结果 数据集。
  2. 在预览表中,每行都包含特定客户的产品推荐,分别标记为 推荐 和userId 。 由于 在示例屏幕截图中 ,num_recommendations Hyperparameter设置为10,因此每行推荐最多可包含10个产品标识,用数字符号(#)分隔。

后续步骤

做得好,您已成功生成产品推荐!
本教程向您介绍了数据科学工作区的工作流程,演示如何通过机器学习将未经处理的原始数据转换为有用的信息。 要进一步了解如何使用数据科学工作区,请继续阅读有关创建零 售销售模式和数据集的下一个指南