Criar um fluxo de dados usando uma fonte de banco de dados na interface

Um fluxo de dados é uma tarefa agendada que recupera e assimila dados de uma origem para um conjunto de dados na Adobe Experience Platform. Este tutorial fornece etapas sobre como criar um fluxo de dados para uma fonte de banco de dados usando a interface do usuário da plataforma.

NOTE
Para criar um fluxo de dados, você já deve ter uma conta autenticada com uma fonte de banco de dados. Uma lista de tutoriais para criar diferentes contas de origem de banco de dados na interface do usuário pode ser encontrada no visão geral das origens.

Introdução

Este tutorial requer uma compreensão funcional dos seguintes componentes da Platform:

  • Origens: a Platform permite que os dados sejam assimilados de várias fontes e fornece a capacidade de estruturar, rotular e aprimorar os dados recebidos usando o Platform serviços.

  • Experience Data Model (XDM) Sistema: a estrutura padronizada pela qual o Experience Platform organiza os dados de experiência do cliente.

  • Real-Time Customer Profile: fornece um perfil de consumidor unificado em tempo real com base em dados agregados de várias fontes.

  • Data Prep: permite que os engenheiros de dados mapeiem, transformem e validem dados de e para o Experience Data Model (XDM).

Adicionar dados

Após criar a conta de origem do banco de dados, a variável Adicionar dados é exibida, fornecendo uma interface para você explorar a hierarquia da tabela da conta de origem do banco de dados.

  • A metade esquerda da interface é um navegador que exibe uma lista das tabelas de dados contidas na sua conta. A interface também inclui uma opção de pesquisa que permite identificar rapidamente os dados de origem que você pretende usar.
  • A metade direita da interface é um painel de visualização, que permite visualizar até 100 linhas de dados.
NOTE
A opção pesquisar dados de origem está disponível para todas as origens com base em tabela, excluindo o Adobe Analytics, Amazon Kinesis, e Azure Event Hubs.

Depois de localizar os dados de origem, selecione a tabela e, em seguida, Próxima.

select-data

Fornecer detalhes do fluxo de dados

A variável Detalhes do fluxo de dados permite selecionar se deseja usar um conjunto de dados existente ou um novo conjunto de dados. Durante esse processo, você também pode definir configurações para Conjunto de dados Perfil, Diagnóstico de erro, Assimilação parcial, e Alertas.

detalhes do fluxo de dados

Usar um conjunto de dados existente

Para assimilar dados em um conjunto de dados existente, selecione Conjunto de dados existente. É possível recuperar um conjunto de dados existente usando o Pesquisa avançada ou rolando pela lista de conjuntos de dados existentes no menu suspenso. Depois de selecionar um conjunto de dados, forneça um nome e uma descrição para o fluxo de dados.

conjunto de dados existente

Usar um novo conjunto de dados

Para assimilar em um novo conjunto de dados, selecione Novo conjunto de dados e forneça um nome de conjunto de dados de saída e uma descrição opcional. Em seguida, selecione um esquema para mapear usando o Pesquisa avançada ou rolando pela lista de esquemas existentes no menu suspenso. Depois de selecionar um esquema, forneça um nome e uma descrição para o fluxo de dados.

novo conjunto de dados

Ativar Profile e diagnóstico de erro

Em seguida, selecione o Conjunto de dados Perfil ativar ou desativar o conjunto de dados para Profile. Isso permite criar uma visualização integral dos atributos e comportamentos de uma entidade. Dados de todos ProfileOs conjuntos de dados habilitados para serão incluídos no Profile As alterações e são aplicadas quando você salva o fluxo de dados.

Diagnóstico de erro permite a geração de mensagens de erro detalhadas para qualquer registro incorreto que ocorra em seu fluxo de dados, enquanto Assimilação parcial O permite assimilar dados que contêm erros, até um determinado limite definido manualmente. Consulte a visão geral da assimilação parcial de lotes para obter mais informações.

perfil e erros

Ativar alertas

Você pode ativar os alertas para receber notificações sobre o status do fluxo de dados. Selecione um alerta na lista para assinar e receber notificações sobre o status do seu fluxo de dados. Para obter mais informações sobre alertas, consulte o manual sobre assinatura de alertas de origens usando a interface do usuário.

Quando terminar de fornecer detalhes ao seu fluxo de dados, selecione Próxima.

alertas

Mapear campos de dados para um esquema XDM

A variável Mapeamento é exibida, fornecendo uma interface para mapear os campos de origem do esquema de origem para os campos XDM de destino apropriados no esquema de destino.

A Platform fornece recomendações inteligentes para campos mapeados automaticamente com base no esquema ou conjunto de dados de destino selecionado. Você pode ajustar manualmente as regras de mapeamento para atender aos seus casos de uso. Com base nas suas necessidades, você pode optar por mapear campos diretamente ou usar funções de preparação de dados para transformar dados de origem para derivar valores calculados ou calculados. Para obter etapas abrangentes sobre o uso da interface do mapeador e campos calculados, consulte o Guia da interface de preparação de dados.

Depois que os dados de origem forem mapeados com sucesso, selecione Próxima.

mapeamento

Programar execuções de assimilação

A variável Agendamento Esta etapa permite configurar uma programação de assimilação para assimilar automaticamente os dados de origem selecionados usando os mapeamentos configurados. Por padrão, o agendamento está definido como Once. Para ajustar a frequência de assimilação, selecione Frequência e selecione uma opção no menu suspenso.

TIP
O intervalo e o preenchimento retroativo não ficam visíveis durante uma assimilação única.

agendamento

Se você definir a frequência de assimilação como Minute, Hour, Dayou Week, você deve definir um intervalo para estabelecer um intervalo de tempo definido entre cada assimilação. Por exemplo, uma frequência de assimilação definida como Day e um intervalo definido como 15 significa que seu fluxo de dados está programado para assimilar dados a cada 15 dias.

Durante essa etapa, você também pode ativar preenchimento retroativo e definir uma coluna para a assimilação incremental de dados. O preenchimento retroativo é usado para assimilar dados históricos, enquanto a coluna definida para assimilação incremental permite que novos dados sejam diferenciados dos dados existentes.

Consulte a tabela abaixo para obter mais informações sobre como programar configurações.

Campo
Descrição
Frequência
A frequência na qual ocorre uma assimilação. As frequências selecionáveis incluem Once, Minute, Hour, Day, e Week.
Interval
Um número inteiro que define o intervalo para a frequência selecionada. O valor do intervalo deve ser um inteiro diferente de zero e deve ser definido como maior ou igual a 15.
Hora de início
Um carimbo de data e hora UTC que indica quando a primeira assimilação está definida para ocorrer. A hora de início deve ser maior ou igual à hora UTC atual.
Preenchimento retroativo
Um valor booleano que determina quais dados são assimilados inicialmente. Se o preenchimento retroativo estiver ativado, todos os arquivos atuais no caminho especificado serão assimilados durante a primeira assimilação agendada. Se o preenchimento retroativo estiver desativado, somente os arquivos carregados entre a primeira execução da assimilação e a hora de início serão assimilados. Os arquivos carregados antes da hora de início não serão assimilados.
Carregar dados incrementais por
Uma opção com um conjunto filtrado de campos de esquema de origem de tipo, data ou hora. O campo selecionado para Carregar dados incrementais por O deve ter seus valores de data e hora no fuso horário UTC para carregar corretamente os dados incrementais. Todas as origens de lote baseadas em tabela selecionam dados incrementais comparando um valor de carimbo de data/hora da coluna delta com a janela de execução de fluxo correspondente Horário UTC e, em seguida, copiando os dados da origem, se algum dado novo for encontrado na janela de tempo UTC.

preenchimento retroativo

Revisar seu fluxo de dados

A variável Revisão é exibida, permitindo que você revise seu novo fluxo de dados antes de ele ser criado. Os detalhes são agrupados nas seguintes categorias:

  • Conexão: mostra o tipo de origem, o caminho relevante do arquivo de origem escolhido e a quantidade de colunas nesse arquivo de origem.
  • Atribuir conjunto de dados e mapear campos: mostra em qual conjunto de dados os dados de origem estão sendo assimilados, incluindo o esquema ao qual o conjunto de dados adere.
  • Agendamento: mostra o período, a frequência e o intervalo ativos da programação de assimilação.

Depois de revisar o fluxo de dados, selecione Concluir e aguarde algum tempo para criar o fluxo de dados.

revisão

Monitorar seu fluxo de dados

Depois que o fluxo de dados for criado, você poderá monitorar os dados que estão sendo assimilados por meio dele para ver informações sobre taxas de assimilação, sucesso e erros. Para obter mais informações sobre como monitorar o fluxo de dados, consulte o tutorial em monitoramento de contas e fluxos de dados na interface do.

Excluir seu fluxo de dados

É possível excluir fluxos de dados que não são mais necessários ou que foram criados incorretamente usando o Excluir disponível na Fluxos de dados espaço de trabalho. Para obter mais informações sobre como excluir fluxos de dados, consulte o tutorial sobre exclusão de fluxos de dados na interface.

Próximas etapas

Ao seguir este tutorial, você criou com sucesso um fluxo de dados para trazer dados da origem do banco de dados para a Platform. Os dados recebidos agora podem ser usados pelo downstream Platform serviços como Real-Time Customer Profile e Data Science Workspace. Consulte os seguintes documentos para obter mais detalhes:

recommendation-more-help
337b99bb-92fb-42ae-b6b7-c7042161d089