Show Menu
主题×

数据集概述

成功引入Adobe Experience Platform的所有数据都会作为数据集保留在Data Lake中。 数据集是存储和管理构建,用于模式集合,通常是表,其中包含(列)和字段(行)。 数据集还包含描述其存储数据各个方面的元数据。
此文档概括介绍了Experience Platform中的数据集。

创建数据集和跟踪元数据

Catalog Service是Experience Platform中数据位置和谱系的记录系统,用于创建和管理数据集。 Catalog跟踪每个数据集的元数据,包括对体验数据模型(XDM)的引用,模式数据集符合该数据集(在下一节中说明),以及摄取到该数据集中的记录数。
有关详细 信息,请参阅 “目录服务”概述。

对数据集数据实施限制

体验数据模型(XDM)是平台组织客户体验数据的标准化框架。 所有被引入平台的模式必须符合预定义的XDM数据,才能作为数据集在数据湖中保留。
所有数据集都包含对XDM模式的引用,该引用约束了可存储数据的格式和结构。 尝试将数据上传到不符合数据集的XDM模式的数据集将导致摄取失败。
有关XDM的详细信息,请参 阅XDM系统概述

将数据引入数据集

Adobe Experience Platform数据摄取代表平台从各种来源获取数据的多种方法。 无论采用何种摄取方法,所有成功摄取的数据都会转换为批处理文件。 批量是由一个或多个要作为单个单位摄取的文件组成的数据单位。然后,这些批处理文件将添加到专用数据集并保留在数据湖中。
有关更多 信息,请参阅 “数据摄取概述”。

将使用标签应用于数据集

Adobe Experience Platform数据管理允许您管理客户数据,以确保符合适用于数据使用的法规、限制和政策。 使用数据使用标签和执行(DULE)作为其核心框架,数据管理允许您应用使用标签以根据适用于该数据的使用策略对数据进行分类。
数据使用标签可以应用于整个数据集或单个数据集字段。 在数据集级别添加的标签由该数据集中的所有字段继承。
有关该 服务的更多信息 ,请参阅数据管理概述。 有关如何在中使用使用标签的 Platform步骤,请参阅以下指南:

下游平台服务中的数据集

一旦数据集用于存储摄取的数据,下游平台服务就会使用这些数据集更新客户用户档案、通过机器学习获得洞察等。
以下是使用数据集进行各种操作的下游服务列表。 请查阅每项服务的文档以了解更多信息。

后续步骤

通过阅读此文档,您已介绍了Experience Platform中数据集的核心用途以及利用数据集的各种平台服务。 有关数据集在平台中的多种使用方式的详细信息,请查看本概述中链接的服务文档。
有关如何在Experience Platform UI中与数据集交互的步骤,请参阅数 据集用户指南