Visão geral dos conjuntos de dados
Todos os dados assimilados com sucesso no Adobe Experience Platform são mantidos na Data Lake como conjuntos de dados. Um conjunto de dados é uma construção de armazenamento e gerenciamento para uma coleção de dados, normalmente uma tabela, que contém um esquema (colunas) e campos (linhas). Os conjuntos de dados também contêm metadados que descrevem vários aspectos dos dados armazenados.
Este documento fornece uma visão geral de alto nível dos conjuntos de dados na Experience Platform.
Criação de conjuntos de dados e metadados de rastreamento
Catalog Service é o sistema de registro para localização e linhagem de dados no Experience Platform, e é usado para criar e gerenciar conjuntos de dados. Catalog rastreia os metadados de cada conjunto de dados, o que inclui uma referência ao Experience Data Model Esquema do (XDM) com o qual o conjunto de dados está em conformidade (explicado na próxima seção) e o número de registros assimilados nesse conjunto de dados.
Consulte a Visão geral do Serviço de catálogo para obter mais informações.
Imposição de restrições em dados do conjunto de dados
Experience Data Model (XDM) é a estrutura padronizada pela qual a Platform organiza os dados de experiência do cliente. Todos os dados assimilados na Platform deve estar em conformidade com um esquema XDM predefinido antes de ser mantido no Data Lake como um conjunto de dados.
Todos os conjuntos de dados contêm uma referência ao esquema XDM que restringe o formato e a estrutura dos dados que eles podem armazenar. Tentar carregar dados para um conjunto de dados que não esteja em conformidade com o esquema XDM do conjunto de dados causará falha na assimilação.
Para obter mais informações sobre o XDM, consulte a Visão geral do sistema XDM.
Assimilar dados em conjuntos de dados
A assimilação de dados do Adobe Experience Platform representa os vários métodos pelos quais Platform A assimila dados de várias fontes. Independentemente do método de assimilação, todos os dados assimilados com êxito são convertidos em arquivos em lote. Lotes são unidades de dados que consistem em um ou mais arquivos que serão assimilados como uma única unidade. Esses arquivos em lote são adicionados a conjuntos de dados dedicados e mantidos no Data Lake.
Consulte a Visão geral da assimilação de dados para obter mais informações.
Rótulos aplicados a conjuntos de dados de esquemas
O Adobe Experience Platform Data Governance permite gerenciar dados de clientes para garantir conformidade com regulamentos, restrições e políticas aplicáveis ao uso de dados. A estrutura de governança de dados permite aplicar rótulos de uso para categorizar os dados de acordo com as políticas de uso que se aplicam a esses dados. Os rótulos podem ser aplicados a esquemas individuais, campos nesses esquemas e conjuntos de dados individuais inteiros. Quando os rótulos são aplicados diretamente a um esquema, eles são propagados para todos os conjuntos de dados existentes e futuros baseados nesse esquema.
Consulte a Visão geral da governança de dados para obter mais informações sobre o serviço. Para obter etapas sobre como trabalhar com rótulos de uso no Platform, consulte os seguintes guias:
Conjuntos de dados no downstream Platform serviços
Depois que os conjuntos de dados são usados para armazenar dados assimilados, eles são usados pelo downstream Platform serviços para atualizar perfis de clientes, obter insights por meio do aprendizado de máquina e muito mais.
Veja a seguir uma lista de serviços downstream que usam conjuntos de dados para várias operações. Consulte a documentação de cada serviço para obter mais informações.
- Data Access API: permite acessar e baixar o conteúdo dos arquivos armazenados em conjuntos de dados.
- Serviço de identidade da Adobe Experience Platform: une as identidades em dispositivos e sistemas, vinculando conjuntos de dados com base nos campos de identidade definidos pelos esquemas XDM aos quais estão em conformidade.
- Real-Time Customer Profile: Aproveita Identity Service para criar perfis detalhados do cliente a partir de seus conjuntos de dados em tempo real. Real-Time Customer Profile O extrai dados do Data Lake e mantém perfis de clientes em seu próprio armazenamento de dados separado.
- Serviço de segmentação do Adobe Experience Platform: permite criar segmentos e gerar públicos a partir da sua Real-Time Customer Profile dados. Esses públicos-alvo podem ser exportados para seus próprios conjuntos de dados na Data Lake.
- Espaço de trabalho de ciência de dados da Adobe Experience Platform: usa aprendizado de máquina e inteligência artificial para descobrir insights em grandes conjuntos de dados.
- Serviço de consulta Adobe Experience Platform: permite usar SQL padrão para consultar dados no Experience Platform, ingressando em qualquer conjunto de dados na Data Lake e captura dos resultados da consulta como um novo conjunto de dados para uso em relatórios, Data Science Workspaceou Real-Time Customer Profile.
- Serviço Adobe Experience Platform Destinations: permite exportar conjuntos de dados para os destinos desejados de marketing por email ou armazenamento na nuvem, para atividades de relatório ou ciência de dados.
Próximas etapas
Ao ler este documento, você foi apresentado aos usos principais dos conjuntos de dados no Experience Platform, bem como os vários Platform que utilizam conjuntos de dados. Para obter mais detalhes sobre as várias maneiras de usar os conjuntos de dados no Platform, revise a documentação do serviço vinculada a esta visão geral.
Para obter etapas sobre como interagir com conjuntos de dados na Experience Platform Interface do usuário do, consulte a guia do usuário de conjuntos de dados.