Show Menu
主题×

数据科学工作区概述

Adobe Experience Platform Data Science Workspace使用机器学习和人工智能从数据中释放洞察。 Data Science Workspace集成到Adobe Experience Platform中,可帮助您跨Adobe解决方案使用内容和数据资产进行预测。
所有技能水平的数据科学家都将发现复杂且易于使用的工具,这些工具支持机器学习方法的快速开发、培训和调整——人工智能技术的所有优点都没有复杂性。
借助数据科学工作区,数据科学家可以轻松创建由机器学习提供支持的智能服务API。 这些服务与其他Adobe服务(包括Adobe目标和Adobe Analytics Cloud)配合使用,帮助您在Web、桌面和移动应用程序中自动实现个性化、有针对性的数字体验。
本指南概述了与数据科学工作区相关的主要概念。

简介

如今的企业将挖掘大数据作为重中之重来进行预测和洞察,帮助他们个性化客户体验并为客户和业务提供更多价值。 尽管如此重要,从数据到洞察的成本也很高。 它通常需要技能娴熟的数据科学家进行密集且耗时的数据研究,以开发支持智能服务的机器学习模型或方法。 这个过程漫长,技术复杂,而且技术娴熟的数据科学家也难以找到。
借助Data Science Workspace,Adobe Experience Platform使您能够在整个企业内引入注重体验的人工智能,从而简化并加速数据到洞察到代码的编写:
  • 机器学习框架和运行时
  • 集成访问存储在Adobe Experience Platform中的数据
  • 基于体验数据模型(XDM)的统一数据模式
  • 机器学习/人工智能和管理大数据集所需的计算能力
  • 预建的机器学习方法可加速向人工智能驱动体验的飞跃
  • 为不同技能水平的数据科学家简化方法的创作、重用和修改
  • 只需单击几下即可实现智能服务发布和共享(无需开发人员),并可监控和再培训以持续优化个性化客户体验
所有技能水平的数据科学家将更快地获得更快、更有效的数字体验。

入门指南

在深入了解数据科学工作区的详细信息之前,以下是关键术语的简要摘要:
搜索词
定义
数据科学工作区
Experience Platform中的Data Science Workspace使客户能够利用Experience Platform和Adobe解决方案中的数据创建机器学习模型,从而生成智能洞察和预测,以编织愉悦的最终用户数字体验。
人工智能
人工智能是计算机系统的理论和发展,能够执行通常需要人类智能的任务,如视觉感知、语音识别、决策和语言之间的翻译。
机器学习
机器学习是一个研究领域,它使计算机能够在不明确编程的情况下学习。
Sensei ML框架
Sensei ML Framework是跨Adobe的统一机器学习框架,它利用Experience Platform上的数据,以更快、可扩展和可重用的方式支持数据科学家开发机器学习驱动的智能服务。
体验数据模型
Experience Data Model(XDM)是Adobe在为客户体验管理定义标准模式(如用户档案和ExperienceEvent)方面所做的标准化工作。
JupyterLab
JupyterLab是Project Jupyter的一个基于Web的开放源代码界面,并紧密集成到Experience Platform中。
菜谱
菜谱是Adobe的模型规范术语,是表示特定机器学习、AI算法或集成算法、处理逻辑和配置的顶级容器,构建和执行经过培训的模型所需,因此有助于解决特定的业务问题。
模型
模型是机器学习菜谱的实例,该菜谱使用历史数据和配置来训练以解决业务用例。
培训
培训是从标记数据学习模式和洞察的过程。
培训的模型
训练的模型表示模型训练过程的可执行输出,其中一组训练数据被应用到模型实例。 经过培训的模型将保留对从其创建的任何智能Web服务的引用。 训练好的模型适合于评分和创建智能Web服务。 可以将对训练好的模型的修改作为新版本进行跟踪。
评分
评分是使用经过培训的模型从数据中生成洞察的过程。
服务
已部署的服务通过API公开人工智能、机器学习模型或高级算法的功能,以便其他服务或应用程序能够使用它来创建智能应用程序。
下图概述了方法、模型、培训运行和评分运行之间的层次关系。

了解数据科学工作区

借助数据科学工作区,数据科学家可以简化在大数据集中发掘洞察的繁琐过程。 Data Science Workspace构建于一个通用的机器学习框架和运行时之上,提供高级的工作流管理、模型管理和可伸缩性。 智能服务支持重复使用机器学习方法,为使用Adobe产品和解决方案创建的各种应用程序提供动力。

一站式数据访问

数据是人工智能和机器学习的基石。
数据科学工作区与Adobe Experience Platform完全集成,包括数据湖、实时客户用户档案和Unified Edge。 同时浏览存储在Adobe Experience Platform中的所有组织数据,以及常见的大数据和深度学习库,如Spark ML和TensorFlow。 如果找不到所需内容,请使用XDM标准化模式收集您自己的数据集。

预建的机器学习方法

Data Science Workspace包含预建的机器学习方法,可满足常见业务需求,如零售销售预测和异常检测,因此数据科学家和开发人员无需从头开始开始。 目前提供三种方法, 产品购买预测 产品推荐 , 以及零售
如果您愿意,您可以根据自己的需求调整预建菜谱,导入菜谱或从头开始开始以构建自定义菜谱。 但是,一旦您开始对菜谱进行培训并进行优化,创建自定义智能服务就不需要开发人员——只需点击几下即可创建有针对性的个性化数字体验。

侧重于数据科学家的工作流程

无论您具备何种数据科学专业知识水平,Data Science Workspace都能帮助简化并加速发现数据洞察并将其应用于数字体验的过程。

数据探索

寻找正确的数据并准备数据是构建有效配方中最耗费劳动力的部分。 Data Science Workspace和Adobe Experience Platform可以帮助您更快速地从数据获取洞察。
在Adobe Experience Platform上,跨渠道数据集中存储在XDM标准化模式中,因此数据更易于查找、理解和清理。 基于共同模式的单一数据存储可以为您节省大量数据探索和准备时间。
在您浏览时,将R、Python或Scala与集成的、托管的Jupyter Notebook一起使用,以浏览平台上的数据目录。 使用这些语言之一,您还可以利用Spark ML和TensorFlow。 从头开始开始,或使用为特定业务问题提供的笔记本模板之一。
作为数据探索工作流程的一部分,您还可以获取新数据或使用现有功能来帮助准备数据。

创作

通过Data Science Workspace,您可以决定如何创作菜谱。
  • 通过浏览预建的菜谱节省时间,该菜谱可满足您的业务需求,您可以按原样使用或配置以满足您的特定需求。
  • 从头开始创建菜谱,使用Jupyter Notebook中的创作运行时开发和注册菜谱。
  • 使用Git和Data Science Workspace之间提供的身份验证和集成功能,将Adobe Experience Platform外创作的菜谱上传到Data Science Workspace中,或从存储库(如Git)导入菜谱代码。

实验

数据科学工作区为实验过程带来了巨大的灵活性。 开始你的菜谱。 然后,使用与超调参数等独特特性配对的相同核心算法创建单独的实例。 您可以创建所需数量的实例,并根据需要对每个实例进行培训和评分。 在您进行培训时,Data Science Workspace会跟踪菜谱、菜谱实例和经过培训的实例以及评估指标,因此您不必进行培训。

操作化

当您对菜谱感到满意时,只需点击几下即可创建出智能服务。 无需编码——您可以自己编写,无需征集开发人员或工程师。 最后,将智能服务发布到Adobe IO并准备好让您的数字体验团队消费。

持续改进

Data Science Workspace跟踪调用智能服务的位置及其执行方式。 数据滚入后,您可以评估智能服务的准确性以关闭循环,并根据需要重新培训方法以提高性能。 结果是客户个性化的精确度不断提高。

访问新功能和数据集

数据科学家可以在通过Adobe服务获得新技术和数据集后立即利用它们。 通过频繁的更新,我们将数据集和技术集成到平台中,这样您就不必再担心了。

数据科学工作区中的访问控制

Experience Platform的访问控制通过 Adobe Admin Console进行管理 。 此功能利用Admin Console中的产品用户档案,该控制台将用户与权限和沙箱关联。 有关详细 信息,请参阅访问控制 概述。
要使用数据科学工作区,必须启用“管理数据科学工作区”权限。
下表概述了启用或禁用此权限的效果:
权限
已启用
禁用
管理数据科学工作区
提供对Data Science Workspace中所有服务的访问。
禁用了对Data Science Workspace中所有服务的API和UI访问。 禁用后,将阻止路由到Data Science Workspace 模型**和服务 页面。

安全与心安

保护数据是Adobe的首要任务。 Adobe通过为帮助遵守行业公认的标准、法规和认证而开发的安全流程和控制来保护您的数据。
作为Adobe安全产品生命周期的一部分,软件和服务中内置了安全性。 要了解Adobe数据和软件安全性、合规性等信息,请访问安全页面https://www.adobe.com/security.html。

沙箱支持

沙箱是Experience Platform的单个实例中的虚拟分区。 每个平台实例都支持一个生产沙箱和多个非生产沙箱,每个沙箱都维护自己的平台资源库。 非生产沙箱允许您测试功能、运行实验和进行自定义配置,而不会影响您的生产沙箱。 有关沙箱的详细信息,请参阅 沙箱概述
目前,Data Science Workspace有以下几个沙箱限制:
  • 计算资源跨生产沙箱和非生产沙箱共享。 生产沙箱的隔离设置将在将来提供。
  • 目前仅在生产沙箱中支持适用于笔记本电脑和方法的Scala/Spark和PySpark工作负载。 今后将提供对非生产沙箱的支持。

Data Science Workspace实际操作情况

预测和洞察为您提供了为每位访问您的网站、联系您的呼叫中心或参与其他数字体验的客户提供高度个性化体验所需的信息。 下面介绍了如何使用数据科学工作区进行日常工作。

定义问题

所有这些都开始了商业问题。 例如,在线呼叫中心需要情境来帮助他们将消极的客户情绪转化为积极情绪。
有关客户的大量数据。 他们浏览了网站,将商品放入购物车,甚至下了订单。 他们可能已收到电子邮件、使用优惠券,或曾联系过呼叫中心。 然后,菜谱需要使用客户及其活动的可用数据来确定购买倾向并推荐客户可能喜欢和使用的优惠。
在呼叫中心联系时,客户在购物车中仍有两双鞋,但已卸下一件衬衫。 利用此信息,智能服务可能建议呼叫中心代理在呼叫期间为鞋子优惠20%的优惠券。 如果客户使用优惠券,则该信息会添加到数据集中,并且客户下次调用时预测结果会更好。

浏览和准备数据

根据定义的业务问题,您知道菜谱应查看客户的所有Web交易,包括网站访问、搜索、页面视图、点击链接、购物车操作、收到的优惠、收到的电子邮件、呼叫中心互动等。
数据科学家通常花费高达75%的时间来创建探索和转换数据的配方。 数据通常来自多个存储库,并保存在不同的模式中——必须先合并并映射数据,才能用它创建菜谱。
如果您从头开始或配置现有菜谱,您可以在组织的集中标准化数据目录中开始数据搜索,这极大地简化了搜索工作。 您甚至会发现,贵组织中的另一位数据科学家已经识别出一个类似的数据集,并选择微调该数据集,而不是从头开始开始。 Adobe Experience Platform中的所有数据都符合标准化的XDM模式,无需创建复杂的模型来加入数据或从数据工程师那里获得帮助。
如果您没有立即找到所需的数据,但它存在于Adobe Experience Platform之外,那么收集更多数据集是一个相对简单的任务,它也将转变为标准化的XDM模式。 您可以使用Jupyter Notebook简化数据预处理——可能首先使用笔记本模板或您以前习惯购买的笔记本。

创作菜谱

如果您已经找到满足所有需求的菜谱,您可以继续尝试。 或者,您也可以稍微修改菜谱或从头开始创建菜谱——充分利用Jupyter Notebook中的Data Science Workspace创作运行时。 使用创作运行时可确保您既可以使用Data Science Workspace培训和评分工作流程,也可以稍后转换菜谱,以便其能够被组织中的其他人存储和重用。
您还可以将菜谱导入Data Science Workspace,并在创建智能服务时利用实验工作流。

试用配方

借助包含核心机器学习算法的菜谱,可以使用单个菜谱创建许多菜谱实例。 这些菜谱实例称为模型。 一个模型需要培训和评估以优化其运行效率和效能,这一过程通常由试验和错误组成。
在培训模型时,会生成培训运行和评估。 Data Science Workspace跟踪每个独特模型及其培训运行的评估指标。 通过试验生成的评估指标将允许您确定最佳的培训运行。
请访 问此部分 ,获取有关如何在Data Science Workspace中培训和评估模型的教程。

实施该模型

当您选择了经过培训的最佳菜谱来满足您的业务需求时,您可以在Data Science Workspace中创建智能服务,而无需开发人员的帮助。 只需点击几下即可——无需编码。 贵组织的其他成员无需重新创建模型即可访问发布的智能服务。
发布的智能服务可配置为在新数据可用时,使用新数据自动进行自我培训。 这可确保您的服务在时间持续时保持其效率和功效。

后续步骤

数据科学工作区可帮助简化数据科学工作流程,从数据收集到算法再到智能服务,面向各个技能水平的数据科学家。 借助Data Science Workspace提供的精良工具,您可以大大缩短从数据到洞察的时间。
更重要的是,Data Science Workspace将Adobe领先营销平台的数据科学和算法优化功能交给了企业数据科学家。 企业首次将专有算法引入该平台,利用Adobe强大的机器学习和AI功能大规模提供高度个性化的客户体验。
凭借品牌专业知识和Adobe的机器学习和AI技能的结合,企业能够在客户提出要求之前为客户提供所需的内容,从而推动更多业务价值和品牌忠诚度。
有关其他信息(如完整的日常工作流程),请首先阅读 Data Science Workspace指导文档

Journey Orchestration

以下视频旨在支持您对数据科学工作区的理解。