Show Menu
TÓPICOS×

Feeds de dados do cliente

Informações básicas sobre Customer Data Feed (CDF) arquivos e instruções sobre como começar. Comece aqui se estiver interessado em receber CDF arquivos ou só quiser mais informações.

Conteúdo e finalidade do arquivo

Um CDF arquivo contém os mesmos dados que uma chamada de Audience Manager evento ( /event ) envia para nossos servidores. Isso inclui dados como IDs de usuário, IDs de característica, IDs de segmento e todos os outros parâmetros capturados por uma chamada de evento. Os Audience Manager sistemas internos processam dados de eventos em um CDF arquivo com conteúdo organizado em campos que aparecem em uma ordem definida. Audience Manager tenta gerar CDF arquivos por hora e armazena-os em um bucket seguro e específico do cliente em um Amazon S3 servidor. Fornecemos esses arquivos para que você possa trabalhar com Audience Manager dados fora dos limites impostos pela interface do usuário.
Você não deve usar CDF arquivos como proxy para monitorar o tráfego da página, reconciliar discrepâncias de relatório, faturamento etc.

Introdução

Não há processo de autoatendimento para iniciar a entrega CDF de arquivos. Contact your Audience Manager consultant or Customer Care to get started. Durante a implementação, seu Audience Manager representante:
  • Configure seu Amazon S3 armazenamento.
  • Forneça credenciais de autenticação somente leitura para o seu bucket de armazenamento de arquivos. S3 Você não poderá ver nem acessar diretórios e arquivos que pertencem a outros clientes.
As notificações e CDF os arquivos serão exibidos no seu S3 bucket quando estiverem prontos para download. Você é responsável por monitorar e baixar arquivos do diretório atribuído. S3 Consulte Notificações de processamento de arquivos de feed de dados do cliente.

Próximas etapas

As seções abaixo e as Perguntas frequentes sobre o Feed de dados do cliente podem ajudá-lo a se familiarizar com esse serviço.

Conteúdo do feed de dados do cliente definido

Lista e define os elementos de dados e as matrizes em um CDF arquivo, por ordem de aparência. As definições incluem tipos de dados, mas essas informações não fazem parte de um CDF arquivo.

Definições

Um CDF arquivo inclui alguns ou todos os campos definidos abaixo. Para obter informações sobre a organização interna do arquivo, consulte Estrutura do arquivo do feed de dados do cliente.
Campo Tipo de dados Descrição
Event Time
Carimbo de data e hora
A hora em que um arquivo CDF foi processado pelos Servidores de Coleta de Dados (DCS). O carimbo de data e hora usa o formato aaaa-mm-dd hh:mm:ss e é definido no fuso horário UTC.
Observação: A hora do evento não é:
  • A hora do evento da página ou da chamada do evento, embora possa estar próxima desses momentos.
  • Relacionado à hora do DCS no nome do arquivo. Consulte também, Horários do Nome do Arquivo do Feed de Dados do Cliente e Horários do Conteúdo do Arquivo....
Device
String
Esta é a ID de usuário exclusiva (UUID), que é uma ID de dispositivo de 38 dígitos para o visitante do site. Consulte também Índice de IDs no Audience Manager .
Container ID
Numérico
A ID do contêiner que aciona sincronizações de ID.
Realized Traits
Matriz numérica
Uma matriz de IDs de características que contém todas as características que um visitante realizou (qualificado para) na chamada de evento.
Observe que a matriz pode conter características para as quais o visitante se qualificou antes e para as quais se qualificam novamente por meio dessa chamada de evento.
Realized Segments
Matriz numérica
Uma matriz de IDs de segmento que contém todos os segmentos que um visitante realizou (qualificado para) na chamada de evento.
Request Parameters
String
Uma string que captura todos os parâmetros (variáveis, IDs, pares chave-valor, IDs de publicidade do dispositivo etc.) passado na chamada de evento.
Exemplo abreviado:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
String
O URL não codificado da página de referência (se houver).
IP Data Type
String
O endereço IP do visitante capturado na chamada de evento.
MCDevice
String
A Experience Cloud ID (MID) atribuída ao visitante do site. See also, Cookies and theExperience Cloud ID service .
All Segments
Matriz numérica
Uma matriz de IDs de segmento que contém segmentos realizados anteriormente e novos segmentos para os quais o visitante está qualificado.
All Traits
Matriz numérica
Uma matriz de IDs de características originais e de terceiros que contém características e novas características realizadas anteriormente para as quais o visitante se qualificou desde o último feed de dados gerado.

Estrutura do arquivo de feed de dados do cliente

Lista e define a estrutura de dados de um CDF arquivo. Isso inclui sequências de dados, delimitadores de campos e separadores, um mapa de arquivos de dados e um arquivo de amostra.

Identificadores e sequência do campo de dados

CDF os arquivos não contêm colunas rotuladas ou cabeçalhos de campo. Em vez disso, um CDF arquivo define campos e matrizes com ASCII caracteres não imprimíveis. Além disso, o CDF arquivo lista cada campo e matriz em uma ordem específica. Compreender os identificadores de campo e a ordem o ajudará a analisar o arquivo corretamente.
Elemento de arquivo CDF Descrição
Separadores de campo e delimitadores
Esses caracteres não imprimíveis definem os elementos e a estrutura do arquivo CDF:
  • Ctrl + a (ASCII 001 ou ^A ) separa dados em campos individuais com um indicador de espaço não imprimível.
  • Ctrl + b (ASCII 002 ou ^B ) separa os dados de uma matriz e os parâmetros de solicitação.
  • Ctrl + c (ASCII 003 ou ^C ) define pares de valores chave.
Sequência de campo
Importante: O Audience Manager reserva o direito de adicionar novos campos ao final do arquivo CDF em versões futuras. Isso significa que o design técnico do seu sistema de análise de arquivos não deve assumir um número fixo de colunas (embora possa assumir uma ordem fixa para colunas existentes).
Os dados no arquivo CDF são exibidos na ordem mostrada abaixo.
  1. Hora do evento
  2. Dispositivo
  3. ID do container
  4. Características Realizadas
  5. Segmentos Realizados
  6. Parâmetros da solicitação
  7. Referer
  8. Endereço IP
  9. Experience Cloud Device ID (ou MID). See also, Cookies and the Experience Cloud ID Service
  10. Todos os segmentos
  11. Todas as características
Para obter descrições de campos, consulte Conteúdo definido #cdf-defineddo feed de dados do cliente.

Mapa de arquivos CDF

CDF os dados do arquivo são exibidos na ordem mostrada abaixo.

Identificação de matrizes

As matrizes em um CDF arquivo iniciam e terminam com o separador de Ctrl + a campo. Isso faz com que o primeiro elemento em uma matriz apareça como um campo de dados independente. Por exemplo, a matriz de características realizadas começa com ^A1234 . O delimitador e a ID da matriz ^B5678 seguem essa entrada. Como resultado, você pode ficar tentado a pensar que o primeiro elemento na matriz de características realizadas é ID 5678 (porque começa com ^B ). Esse não é o caso, e é por isso que você precisa estar familiarizado com a sequência e estrutura de um arquivo de dados. Embora o primeiro elemento na matriz de características realizadas (ou qualquer outra matriz em um CDF arquivo) comece com ^A , a ordem de aparência ou posição no arquivo define o início de uma matriz. E o primeiro elemento em um storage é sempre separado da entrada anterior por ^A .

Arquivo CDF de amostra

Um arquivo de amostra CDF pode ser semelhante ao seguinte. Inserimos quebras de linha neste exemplo para ajudar a ajustar a página.

Convenções de nomenclatura de arquivos do feed de dados do cliente

As seções abaixo listam e definem os elementos no nome do seu CDF arquivo.

Nome do arquivo CDF: Sintaxe e exemplo

Um nome de CDF arquivo típico contém os elementos listados abaixo. Note, italics indicates a variable placeholder:

Sintaxe

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

Exemplo

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

Em seu período de S3 armazenamento, os arquivos são classificados em ordem crescente pela ID do parceiro (PID), dia e hora.

Elementos de nome de arquivo CDF definidos

A tabela a seguir lista e define os elementos em um nome de CDF arquivo.
Elemento de nome de arquivo Descrição
s3://aam-cdf/
Esse é o bucket de armazenamento raiz padrão para seu arquivo CDF em um servidor Amazon S3.
your S3 bucket name
O nome do bucket S3 somente leitura que armazena seus arquivos CDF.
day= yyyy-mm-dd
A data em que seu arquivo foi processado.
hour= hh
Um valor de hora expresso em notação de 24 horas e definido no fuso horário UTC. Consulte também, Horários do Nome do Arquivo do Feed de Dados do Cliente e Horários do Conteúdo do Arquivo....
partner ID
Sua ID do parceiro.
AAM process ID _0
Uma ID de processo interna do Audience Manager .
.gz
Uma extensão de arquivo gzip. Os arquivos CDF são compactados por gzip.

Notificações de processamento de arquivo de feed de dados do cliente

Audience Manager grava um .info arquivo no seu S3 diretório para informá-lo quando seu Customer Data File (CDF) está pronto para download. O .info arquivo também inclui metadados JSON formatados sobre o conteúdo de seus CDF arquivos. Consulte esta seção para obter informações sobre a sintaxe e os campos usados por este arquivo de notificação.

Arquivo de informações de amostra

Cada .info arquivo contém uma seção Files e Totals . A Files seção contém uma matriz que contém métricas específicas para cada arquivo por hora. A Totals seção contém métricas agregadas em todos os CDF arquivos de um dia específico. O conteúdo do seu .info arquivo pode ser semelhante ao seguinte exemplo.
{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Campos de arquivo de informações definidos

As tabelas a seguir listam e definem os elementos em um CDF .info arquivo.

Objeto de arquivos

Campo Descrição
Files
Inicia o storage que contém metadados sobre seus arquivos CDF.
FileByteSize
Tamanho do arquivo em bytes.
FileChecksumMD5
Amazon S3 ETag. O número após o hífen mostra o número de partes usadas para criar o arquivo durante o upload de várias partes. O arquivo não ETag é idêntico à soma de verificação MD5 do arquivo.
FileName
O nome do arquivo. Consulte Convenções de nomenclatura do arquivo de feed de dados do cliente.
FileSequenceNumber
Um número de índice para cada arquivo.

Objeto Totais

Campo Descrição
Totals
Inicia o objeto que contém dados agregados sobre todos os arquivos CDF.
Day
O dia em que os dados estão disponíveis. Usa o formato aaaa-mm-dd .
Hour
A hora para a qual os dados estão disponíveis. Usa o formato de 24 horas definido no fuso horário UTC.
TotalByteSize
Tamanho total de todos os arquivos CDF daquela data, em bytes.
TotalNumberFiles
O número total de arquivos carregados no diretório S3.

Os tempos de nome do arquivo do feed de dados do cliente e os tempos de conteúdo do arquivo são diferentes

Seu CDF arquivo contém carimbos de data e hora no nome do arquivo e no conteúdo do arquivo. Esses carimbos de data e hora registram processos de evento diferentes para o mesmo CDF arquivo. Não é incomum ver carimbos de data e hora diferentes no nome e conteúdo do mesmo arquivo. Compreender cada carimbo de data e hora pode ajudar a evitar erros comuns ao trabalhar com esses dados ou tentar classificá-los por tempo.

Localização de carimbos de data e hora do arquivo CDF

CDF os arquivos registram o tempo de forma diferente em 2 locais separados.

Como entender a diferença entre os carimbos de data e hora

A tabela a seguir fornece detalhes adicionais sobre os carimbos de data e hora do CDF arquivo, juntamente com informações sobre como usá-los corretamente.
Localização do carimbo de data e hora
Descrição
Nome do arquivo
O carimbo de data e hora em seu nome de arquivo CDF marca a hora em que Audience Manager começou a preparar o arquivo para entrega. Esse carimbo de data e hora é definido no fuso horário UTC. Ele usa o hour= parâmetro, com o tempo formatado como uma hora de 2 dígitos em uma notação de 24 horas. Essa hora pode ser diferente da hora do evento registrada no conteúdo do arquivo. DETALHAMENTOAo trabalhar com arquivos CDF, às vezes você perceberá que seu bucket S3 está vazio por uma hora específica. Um compartimento vazio significa um dos seguintes:
  • Não há dados para aquela hora em particular.
  • Nossos servidores estão sob cargas pesadas e não podem processar arquivos por uma hora específica. Quando o servidor pega, coloca os arquivos que deveriam ter entrado em um período anterior em um bucket com um valor de tempo posterior. Por exemplo, você verá isso quando um arquivo que deveria estar na hora 17 do bucket for exibido na hora 18 do bucket (com hour=18 o nome do arquivo). Nesse caso, o servidor provavelmente começou a processar seu arquivo na hora 17, mas não pôde concluí-lo dentro desse intervalo de tempo. Em vez disso, o arquivo é encaminhado para o próximo intervalo de tempo por hora.
Importante : Não use o carimbo de data e hora do nome do arquivo para agrupar eventos por hora. Se precisar agrupar por hora, use o EventTime carimbo de data e hora no conteúdo do arquivo.
Conteúdo do arquivo
O carimbo de data e hora no conteúdo do arquivo CDF marca o momento em que os servidores de coleta de dados iniciaram o processamento do arquivo. Esse carimbo de data e hora é definido no fuso horário UTC. Ele usa o EventTime campo, com o tempo formatado como yyyy-mm-dd hh:mm:ss . Essa hora está próxima à hora real do evento na página, mas pode ser diferente do indicador de hora no nome do arquivo.
Dica : Ao contrário do hour= carimbo de data e hora no nome do arquivo, é possível usar EventTime para agrupar dados por hora.