Show Menu
TEMAS×

Introducción a los conjuntos de datos

Todos los datos que se ingieren correctamente en Adobe Experience Platform se conservan dentro de los Data Lake conjuntos de datos. Un conjunto de datos es un almacenamiento y una construcción de administración para una colección de datos, generalmente una tabla, que contiene un esquema (columnas) y campos (filas). Los conjuntos de datos también contienen metadatos que describen varios aspectos de los datos que almacenan.
Este documento proporciona información general de alto nivel sobre los conjuntos de datos de Experience Platform.

Creación de conjuntos de datos y seguimiento de metadatos

Catalog Service es el sistema de registro para la ubicación y el linaje de los datos dentro Experience Platform, y se utiliza para crear y administrar conjuntos de datos. Catalog rastrea los metadatos de cada conjunto de datos, que incluye una referencia al esquema Experience Data Model (XDM) al que se ajusta el conjunto de datos (explicado en la siguiente sección) y el número de registros ingeridos en ese conjunto de datos.
Consulte la descripción general del servicio de catálogos para obtener más información.

Imponer restricciones en los datos del conjunto de datos

Experience Data Model (XDM) es el marco estandarizado mediante el cual Platform organiza los datos de experiencia del cliente. Todos los datos que se ingieren en Platform deben cumplir un esquema XDM predefinido para poder persistir en el Data Lake conjunto de datos.
Todos los conjuntos de datos contienen una referencia al esquema XDM que restringe el formato y la estructura de los datos que pueden almacenar. Si se intenta cargar datos en un conjunto de datos que no se ajusta al esquema XDM del conjunto de datos, se producirá un error en la ingestión.
Para obtener más información sobre XDM, consulte la descripción general del sistema XDM.

Ingreso de datos en conjuntos de datos

La ingestión de datos de Adobe Experience Platform representa los múltiples métodos mediante los cuales Platform ingesta datos de diversas fuentes. Independientemente del método de ingestión, todos los datos ingestados correctamente se convierten en archivos por lotes. Los lotes son unidades de datos compuestas por uno o más archivos que se van a introducir como una sola unidad. Estos archivos por lotes se agregan luego a conjuntos de datos dedicados y se mantienen dentro de los Data Lake.
Para obtener más información, consulte la descripción general de la inserción de datos.

Aplicación de etiquetas de uso a conjuntos de datos

Adobe Experience Platform Data Governance le permite administrar los datos de los clientes para garantizar el cumplimiento de las regulaciones, restricciones y políticas aplicables al uso de los datos. El Data Governance marco permite aplicar etiquetas de uso para categorizar los datos según las políticas de uso que se aplican a dichos datos.
Las etiquetas de uso de datos se pueden aplicar a conjuntos de datos completos o a campos de conjuntos de datos individuales. Las etiquetas agregadas en el nivel de conjunto de datos son heredadas por todos los campos dentro de ese conjunto de datos.
Consulte la información general de Gobierno de datos para obtener más información sobre el servicio. Para ver los pasos sobre cómo trabajar con etiquetas de uso en Platform, consulte las siguientes guías:

Conjuntos de datos en servicios Platform descendentes

Una vez que los datasets se han utilizado para almacenar datos ingestados, estos datasets los utilizan los servicios Platform descendentes para actualizar los perfiles de los clientes, obtener perspectivas a través del aprendizaje automático y mucho más.
A continuación se muestra una lista de servicios de flujo descendente que utilizan conjuntos de datos para diversas operaciones. Consulte la documentación de cada servicio para obtener más información.
  • Data Access API : Permite acceder y descargar el contenido de los archivos almacenados en los conjuntos de datos.
  • Adobe Experience Platform Identity Service : Permite unir identidades entre dispositivos y sistemas, vinculando conjuntos de datos en función de los campos de identidad definidos por los esquemas XDM a los que se ajustan.
  • Perfil del cliente en tiempo real de : Aprovecha Identity Service para crear perfiles detallados de clientes a partir de sus conjuntos de datos en tiempo real. Real-time Customer Profile extrae datos de los perfiles del cliente Data Lake y los mantiene en su propio almacén de datos independiente.
  • Servicio de segmentación de Adobe Experience Platform: Le permite generar segmentos y audiencias a partir de sus Real-time Customer Profile datos. Estas audiencias se pueden exportar a sus propios conjuntos de datos dentro del Data Lake.
  • Adobe Experience Platform Data Science Workspace : Utiliza aprendizaje automático e inteligencia artificial para descubrir perspectivas en grandes conjuntos de datos.
  • Servicio de Consulta de Adobe Experience Platform: Permite utilizar SQL estándar para consulta de datos en Experience Platform, unir cualquier conjunto de datos dentro del Data Lake y capturar los resultados de consulta como un nuevo conjunto de datos para su uso en sistema de informes, Data Science Workspaceo Real-time Customer Profile.
  • Servicio de decisiones de Adobe Experience Platform: Aprovecha Real-time Customer Profile para determinar la opción más probable que un cliente elegirá a partir de un conjunto de opciones, en función de los datos de comportamiento que Profile extraen de conjuntos de datos habilitados.

Pasos siguientes

Al leer este documento, se le han presentado los usos principales de los conjuntos de datos en Experience Platform, así como los diversos Platform servicios que utilizan conjuntos de datos. Para obtener más información sobre las muchas formas en que se utilizan los conjuntos de datos en Platform, consulte la documentación del servicio vinculada a través de esta información general.
Para ver los pasos sobre cómo interactuar con conjuntos de datos dentro de la Experience Platform interfaz de usuario, consulte la guía del usuario de conjuntos de datos.