Show Menu
TÓPICOS×

Customer Data Feeds

Informações básicas sobre Customer Data Feed (CDF) arquivos e instruções sobre como começar. Start aqui se você estiver interessado em receber CDF arquivos ou só quiser mais informações.

Conteúdo e finalidade do arquivo

Um arquivo CDF contém os mesmos dados que uma chamada de evento Audience Manager ( /event ) envia para nossos servidores. This includes data like user IDs, trait IDs, segment IDs, and all the other parameters captured by an event call. Os Audience Manager sistemas internos processam os dados do evento em um CDF arquivo com conteúdo organizado em campos que aparecem em uma ordem definida. Audience Manager tenta gerar CDF arquivos por hora e armazena-os em um bucket seguro e específico do cliente em um Amazon S3 servidor. Fornecemos esses arquivos para que você possa trabalhar com Audience Manager dados fora dos limites impostos pela interface do usuário.
Observe as seguintes restrições ao trabalhar com arquivos CDF:
  • Antes de configurar o delivery de arquivo CDF, verifique se você tem as permissões apropriadas de provedores de dados de terceiros para a exportação de características de terceiros.
  • Você não deve usar CDF arquivos como proxy para monitorar o tráfego da página, reconciliar discrepâncias de relatório, faturamento etc.

Introdução

Não há processo de autoatendimento para o start do delivery CDF de arquivos. Contact your Audience Manager consultant or Customer Care to get started. Durante a implementação, seu Audience Manager representante:
  • Configure seu balde de Amazon S3 armazenamentos.
  • Forneça credenciais de autenticação somente leitura para o seu armazenamento de arquivos. S3 Você não poderá ver nem acessar diretórios e arquivos que pertencem a outros clientes.
As notificações e CDF os arquivos serão exibidos no seu S3 bucket quando estiverem prontos para download. Você é responsável por monitorar e baixar arquivos do diretório atribuído. S3 Consulte Notificações de processamento de arquivos de feed de dados do cliente .

Próximas etapas

As seções abaixo e as Perguntas frequentes sobre o Feed de dados do cliente podem ajudá-lo a se familiarizar com esse serviço.

Customer Data Feed Conteúdo definido

Lista e define os elementos de dados e as matrizes em um CDF arquivo, por ordem de aparência. As definições incluem tipos de dados, mas essas informações não fazem parte de um CDF arquivo.

Definições

Um CDF arquivo inclui alguns ou todos os campos definidos abaixo. Para obter informações sobre a organização interna do arquivo, consulte Estrutura do arquivo do feed de dados do cliente.
Campo Tipo de dados Descrição
Event Time
Carimbo de data e hora
A hora em que um arquivo CDF foi processado pelos Servidores de Coleta de Dados (DCS). O carimbo de data e hora usa o formato aaaa-mm-dd hh:mm:ss e é definido no fuso horário UTC.
Observação: A Hora do Evento não é:
Device
String
Esta é a ID de usuário exclusiva (UUID), que é uma ID de dispositivo de 38 dígitos para o visitante do site. Consulte também Índice de IDs no Audience Manager .
Container ID
Numérico
A ID do container que aciona sincronizações de ID.
Realized Traits
Matriz numérica
Uma matriz de IDs de características que contém todas as características que um visitante realizou (qualificado para) na chamada do evento.
Observe que a matriz pode conter características para as quais o visitante já se qualificou e para as quais se qualificam novamente por meio dessa chamada de evento.
Realized Segments
Matriz numérica
Uma matriz de IDs de segmento que contém todos os segmentos que um visitante realizou (qualificado para) na chamada do evento.
Request Parameters
String
Uma string que captura todos os parâmetros (variáveis, IDs, pares chave-valor, IDs de publicidade do dispositivo etc.) enviado na chamada do evento.
Exemplo abreviado:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
String
O URL não codificado da página de referência (se houver).
IP Data Type
String
O endereço IP do visitante capturado na chamada do evento.
MCDevice
String
A ID do Experience Cloud (MID) atribuída ao visitante do site. Consulte também Cookies e o serviço cookies.html de identidade do Experience Platform da Adobe.
All Segments
Matriz numérica
Uma matriz de IDs de segmento que contém segmentos realizados anteriormente e novos segmentos para os quais o visitante está qualificado.
All Traits
Matriz numérica
Uma matriz de IDs de características originais e de terceiros que contém características e novas características que o visitante qualificou desde o último feed de dados gerado.

Customer Data Feed Estrutura do arquivo

Lista e define a estrutura de dados de um CDF arquivo. Isso inclui sequências de dados, delimitadores de campos e separadores, um mapa de arquivos de dados e um arquivo de amostra.

Identificadores e sequência do campo de dados

CDF os arquivos não contêm colunas rotuladas nem cabeçalhos de campo. Em vez disso, um CDF arquivo define campos e matrizes com ASCII caracteres não imprimíveis. Além disso, o CDF arquivo lista cada campo e matriz em uma ordem específica. Compreender os identificadores de campo e a ordem o ajudará a analisar o arquivo corretamente.
Elemento de arquivo CDF Descrição
Separadores de campo e delimitadores
Esses caracteres não imprimíveis definem os elementos e a estrutura do arquivo CDF:
  • Ctrl + a (ASCII 001 ou ^A ) separa dados em campos individuais com um indicador de espaço não imprimível.
  • Ctrl + b (ASCII 002 ou ^B ) separa os dados de uma matriz e os parâmetros de solicitação.
  • Ctrl + c (ASCII 003 ou ^C ) define pares de valores chave.
Sequência de campo
Importante: O Audience Manager reserva-se o direito de adicionar novos campos ao final do arquivo CDF em versões futuras. Isso significa que o design técnico do seu sistema de análise de arquivos não deve assumir um número fixo de colunas (embora possa assumir uma ordem fixa para colunas existentes).
Os dados no arquivo CDF são exibidos na ordem mostrada abaixo.
  1. Hora do Evento
  2. Dispositivo
  3. ID do container
  4. Características Realizadas
  5. Segmentos Realizados
  6. Parâmetros da solicitação
  7. Referer
  8. Endereço IP
  9. ID do dispositivo Experience Cloud (ou MID). See also, Cookies and the Adobe Experience Platform Identity Service
  10. Todos os segmentos
  11. Todas as características
Para obter descrições de campos, consulte Conteúdo definido #cdf-defined do feed de dados do cliente.

CDF Mapa de arquivos

CDF os dados do arquivo são exibidos na ordem mostrada abaixo.

Identificação de matrizes

Arrays em um start de CDF arquivo e terminam com o separador de Ctrl + a campo. Isso faz com que o primeiro elemento em uma matriz apareça como um campo de dados independente. Por exemplo, o traits array realizado com ^A1234 . O delimitador e a ID da matriz ^B5678 seguem essa entrada. Como resultado, você pode estar tentado a pensar que o primeiro elemento na traits matriz realizada é ID 5678 (porque ela é start com ^B ). Esse não é o caso, e é por isso que você precisa estar familiarizado com a sequência e estrutura de um arquivo de dados. Mesmo que o primeiro elemento no trait array realizado (ou qualquer outra matriz em um CDF arquivo) tenha start com ^A , a ordem de aparência ou posição no arquivo define o start de uma matriz. E o primeiro elemento em um storage é sempre separado da entrada anterior por ^A .

Sample CDF File

Um arquivo de amostra CDF pode ser semelhante ao seguinte. Inserimos quebras de linha neste exemplo para ajudar a ajustar a página.

Customer Data Feed Convenções de nomenclatura de arquivos

As seções abaixo são listas e definem os elementos no nome do seu CDF arquivo.

CDF Nome do arquivo: Sintaxe e exemplo

Um nome de CDF arquivo típico contém os elementos listados abaixo. Note, italics indicates a variable placeholder:

Sintaxe

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

Exemplo

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

No seu grupo de S3 armazenamentos, os arquivos são classificados em ordem crescente pela ID do parceiro (PID), dia e hora.

CDF Elementos de nome de arquivo definidos

A tabela a seguir lista e define os elementos em um nome de CDF arquivo.
Elemento de nome de arquivo Descrição
s3://aam-cdf/
Esse é o bucket de armazenamento raiz padrão para seu arquivo CDF em um servidor Amazon S3.
your S3 bucket name
O nome do bucket S3 somente leitura que armazena seus arquivos CDF.
day= yyyy-mm-dd
A data em que seu arquivo foi processado.
hour= hh
Um valor de hora expresso em notação de 24 horas e definido no fuso horário UTC. Consulte também, Horários do Nome do Arquivo do Feed de Dados do Cliente e Horários do Conteúdo do Arquivo... .
partner ID
Sua ID do parceiro.
AAM process ID _0
Uma ID de processo Audience Manager interna.
.gz
Uma extensão de arquivo gzip. Os arquivos CDF são compactados por gzip.

Customer Data Feed Notificações de processamento de arquivo

Audience Manager grava um .info arquivo no seu S3 diretório para informá-lo quando seu Customer Data File (CDF) está pronto para download. O .info arquivo também inclui metadados JSON formatados sobre o conteúdo de seus CDF arquivos. Consulte esta seção para obter informações sobre a sintaxe e os campos usados por este arquivo de notificação.

Arquivo de informações de amostra

Cada .info arquivo contém uma seção Files e Totals . A Files seção contém uma matriz que contém métricas específicas para cada arquivo por hora. A Totals seção contém métricas agregadas em todos os CDF arquivos de um dia específico. O conteúdo do seu .info arquivo pode ser semelhante ao seguinte exemplo.
{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Campos de arquivo de informações definidos

As tabelas a seguir são listas e definem os elementos em um CDF .info arquivo.

Objeto de arquivos

Campo Descrição
Files
Start o storage que contém metadados sobre seus arquivos CDF.
FileByteSize
Tamanho do arquivo em bytes.
FileChecksumMD5
Amazon S3 ETag. O número após o hífen mostra o número de partes usadas para criar o arquivo durante o upload de várias partes. O arquivo não ETag é idêntico à soma de verificação MD5 do arquivo.
FileName
FileSequenceNumber
Um número de índice para cada arquivo.

Objeto Totais

Campo Descrição
Totals
Start o objeto que contém dados agregados sobre todos os arquivos CDF.
Day
O dia em que os dados estão disponíveis. Usa o formato aaaa-mm-dd .
Hour
A hora para a qual os dados estão disponíveis. Usa o formato de 24 horas definido no fuso horário UTC.
TotalByteSize
Tamanho total de todos os arquivos CDF daquela data, em bytes.
TotalNumberFiles
O número total de arquivos carregados no diretório S3.

Customer Data Feed As horas de nome do arquivo e as horas de conteúdo do arquivo são diferentes

Seu CDF arquivo contém carimbos de data e hora no nome do arquivo e no conteúdo do arquivo. Esses carimbos de data e hora registram processos de evento diferentes para o mesmo CDF arquivo. Não é incomum ver carimbos de data e hora diferentes no nome e conteúdo do mesmo arquivo. Compreender cada carimbo de data e hora pode ajudar a evitar erros comuns ao trabalhar com esses dados ou tentar classificá-los por tempo.

Localização de carimbos de data e hora CDF do arquivo

CDF os arquivos registram o tempo de forma diferente em 2 locais separados.

Como entender a diferença entre os carimbos de data e hora

A tabela a seguir fornece detalhes adicionais sobre os carimbos de data e hora do CDF arquivo, juntamente com informações sobre como usá-los corretamente.
Localização do carimbo de data e hora
Descrição
Nome do arquivo
O carimbo de data e hora no nome CDF do arquivo marca a hora em que Audience Manager começou a preparar o arquivo para o delivery. Esse carimbo de data e hora é definido no UTC fuso horário. Ele usa o hour= parâmetro, com o tempo formatado como uma hora de 2 dígitos em uma notação de 24 horas. Essa hora pode ser diferente da hora do evento registrada no conteúdo do arquivo. Ao trabalhar com CDF arquivos, às vezes você perceberá que seu S3 bucket está vazio por uma hora específica. Um compartimento vazio significa um dos seguintes:
  • Não há dados para aquela hora em particular.
  • Nossos servidores estão sob cargas pesadas e não podem processar arquivos por uma hora específica. Quando o servidor pega, coloca os arquivos que deveriam ter entrado em um período anterior em um bucket com um valor de tempo posterior. Por exemplo, você verá isso quando um arquivo que deveria estar na hora 17 do bucket for exibido na hora 18 do bucket (com hour=18 o nome do arquivo). Nesse caso, o servidor provavelmente começou a processar seu arquivo na hora 17, mas não pôde concluí-lo dentro desse intervalo de tempo. Em vez disso, o arquivo é encaminhado para o próximo intervalo de tempo por hora.
Importante : Não use o carimbo de data e hora do nome do arquivo para agrupar eventos por hora. Se precisar agrupar por hora, use o EventTime carimbo de data e hora no conteúdo do arquivo.
Conteúdo do arquivo
O carimbo de data e hora no conteúdo CDF do arquivo marca a hora em que o arquivo foi Data Collection Servers iniciado. Esse carimbo de data e hora é definido no UTC fuso horário. Ele usa o EventTime campo, com o tempo formatado como yyyy-mm-dd hh:mm:ss . Essa hora está próxima à hora real do evento na página, mas pode ser diferente do indicador de hora no nome do arquivo.
Dica : Diferentemente do hour= carimbo de data e hora no nome do arquivo, é possível usar EventTime para agrupar dados por hora.