Show Menu
TEMAS×

Fuentes de datos del cliente

Información básica sobre Customer Data Feed (CDF) archivos e instrucciones sobre cómo empezar. Comience aquí si está interesado en recibir CDF archivos o sólo desea más información.

Contenido y propósito del archivo

Un CDF archivo contiene los mismos datos que una llamada Audience Manager de evento ( /event ) envía a nuestros servidores. Esto incluye datos como ID de usuario, ID de características, ID de segmentos y todos los demás parámetros capturados por una llamada de evento. Los Audience Manager sistemas internos procesan los datos de eventos en un CDF archivo con contenido organizado en campos que aparecen en un orden establecido. Audience Manager intenta generar CDF archivos por hora y los almacena en un bloque seguro y específico para el cliente en un Amazon S3 servidor. Proporcionamos estos archivos para que pueda trabajar con Audience Manager datos fuera de los límites impuestos por nuestra interfaz de usuario.
No debe utilizar CDF los archivos como proxy para supervisar el tráfico de páginas, reconciliar discrepancias en los informes, para facturar, etc.

Introducción

No hay ningún proceso de autoservicio para iniciar la entrega CDF de archivos. Contact your Audience Manager consultant or Customer Care to get started. Durante la implementación, su Audience Manager representante:
  • Configure el depósito Amazon S3 de almacenamiento.
  • Proporcione credenciales de autenticación de solo lectura al bloque de almacenamiento de archivos. S3 No podrá ver ni acceder a directorios y archivos que pertenezcan a otros clientes.
Las notificaciones y CDF archivos aparecerán en el S3 bloque cuando estén listos para la descarga. Usted es el responsable de supervisar y descargar archivos del S3 directorio asignado. Consulte Notificaciones de procesamiento de archivos de fuentes de datos de clientes .

Pasos siguientes

Las secciones a continuación y las preguntas más frecuentes sobre fuentes de datos de clientes pueden ayudarle a familiarizarse con este servicio.

Contenido de fuente de datos del cliente definido

Enumera y define los elementos de datos y las matrices de un CDF archivo, por orden de aspecto. Las definiciones incluyen tipos de datos, pero esta información no forma parte de un CDF archivo.

Definiciones

Un CDF archivo incluye algunos o todos los campos definidos a continuación. Para obtener información sobre la organización de archivos internos, consulte Estructura de archivos de fuentes de datos de clientes.
Campo Tipo de datos Descripción
Hora del evento
Marca de hora
Hora a la que los servidores de recopilación de datos (DCS) procesaron un archivo CDF. La marca de tiempo utiliza el formato aaaa-mm-dd hh:mm:ss y se establece en la zona horaria UTC.
Nota: La hora del evento no es :
  • Hora del evento de página o de la llamada del evento, aunque puede estar cerca de esas horas.
  • Relacionado con la hora de DCS en el nombre del archivo. Consulte también Tiempos del nombre del archivo de la fuente de datos del cliente y Tiempos del contenido del archivo....
Device
Cadena
Es el ID de usuario único (UUID), que es un ID de dispositivo de 38 dígitos para el visitante del sitio. Consulte también Índice de ID en Audience Manager .
ID de contenedor
Numérica
ID del contenedor que activa la sincronización de ID.
Características realizadas
Matriz numérica
Matriz de ID de características que contiene todas las características que un visitante ha realizado (para las que está cualificado) en la llamada de evento.
Tenga en cuenta que la matriz puede contener características para las que el visitante ya había calificado y para las que vuelve a calificar a través de esta llamada de evento.
Segmentos realizados
Matriz numérica
Matriz de ID de segmento que contiene todos los segmentos que un visitante ha realizado (para los que cumple los requisitos) en la llamada de evento.
Parámetros de solicitud
Cadena
Una cadena que captura todos los parámetros (variables, ID, pares de clave-valor, ID de publicidad de dispositivo, etc.) pasó en la llamada de evento.
Ejemplo abreviado:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD5965E9C4%011,c_contextData.a.a vSessionLength:583
Tipo de datos de referente
Cadena
Dirección URL no codificada de la página de referencia (si existe).
Tipo de datos IP
Cadena
La dirección IP del visitante capturada en la llamada del evento.
MCDevice
Cadena
El ID de Experience Cloud (MID) asignado al visitante del sitio. See also, Cookies and theExperience Cloud ID service .
Todos los segmentos
Matriz numérica
Matriz de ID de segmentos que contiene segmentos realizados anteriormente y segmentos nuevos para los que el visitante está cualificado.
Todas las características
Matriz numérica
Matriz de ID de características de origen y de terceros que contiene características realizadas anteriormente y características nuevas para las que el visitante ha calificado desde la última fuente de datos generada.

Estructura del archivo de fuente de datos del cliente

Enumera y define la estructura de datos de un CDF archivo. Esto incluye secuencias de datos, delimitadores y separadores de campos, una asignación de archivos de datos y un archivo de muestra.

Secuencia e identificadores de campo de datos

CDF los archivos no contienen columnas etiquetadas ni encabezados de campo. En su lugar, un CDF archivo define campos y matrices con ASCII caracteres no imprimibles. Además, el CDF archivo enumera cada campo y matriz en un orden específico. El comprender los identificadores de campo y el orden le ayudará a analizar el archivo correctamente.
Elemento de archivo CDF Descripción
Separadores y delimitadores de campo
Estos caracteres no imprimibles definen los elementos y la estructura del archivo CDF:
  • Ctrl + a (ASCII 001 o ^A ) separa los datos de campos individuales con un indicador de espacio no imprimible.
  • Ctrl + b (ASCII 002 o ^B ) separa los datos de una matriz y los parámetros de solicitud.
  • Ctrl + c (ASCII 003 o ^C ) define pares clave-valor.
Secuencia de campos
Importante: Audience Manager se reserva el derecho de agregar nuevos campos al final del archivo CDF en futuras versiones. Esto significa que el diseño técnico del sistema de análisis de archivos no debe asumir un número fijo de columnas (aunque puede asumir un orden fijo para las columnas existentes).
Los datos del archivo CDF aparecen en el orden que se muestra a continuación.
  1. Hora del evento
  2. Device
  3. ID de contenedor
  4. Características realizadas
  5. Segmentos realizados
  6. Parámetros de solicitud
  7. Referer
  8. Dirección IP
  9. ID del dispositivo de Experience Cloud (o MID). See also, Cookies and the Experience Cloud ID Service
  10. Todos los segmentos
  11. Todas las características
Para ver las descripciones de los campos, consulte Contenido de fuente de datos del cliente definido .

Mapa de archivos CDF

CDF los datos del archivo aparecen en el orden que se muestra a continuación.

Identificación de matrices

Las matrices de un CDF archivo comienzan y finalizan con el separador de Ctrl + a campos. Esto hace que el primer elemento de una matriz aparezca como un campo de datos independiente. Por ejemplo, la matriz de características realizadas comienza por ^A1234 . El delimitador de matriz y la ID ^B5678 siguen a esta entrada. Como resultado, podría sentir la tentación de pensar que el primer elemento de la matriz de características realizadas es ID 5678 (porque comienza con ^B ). Este no es el caso, por lo que debe estar familiarizado con la secuencia y la estructura de un archivo de datos. Aunque el primer elemento de la matriz de características realizada (o cualquiera de las demás matrices de un CDF archivo) comience por ^A , el orden de aspecto o posición del archivo define el inicio de una matriz. Y, el primer elemento de una matriz siempre está separado de la entrada anterior por ^A .

Archivo CDF de muestra

Un CDF archivo de muestra podría tener un aspecto similar al siguiente. Hemos insertado saltos de línea en este ejemplo para ayudarle a ajustar la página.

Convenciones de nomenclatura de archivos de fuentes de datos de clientes

Las secciones siguientes enumeran y definen los elementos en el nombre CDF del archivo.

Nombre de archivo CDF: Sintaxis y ejemplo

Un nombre CDF de archivo típico contiene los elementos que se enumeran a continuación. Note, italics indicates a variable placeholder:

Sintaxis

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

Ejemplo

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

En el bloque S3 de almacenamiento, los archivos se ordenan en orden ascendente por ID de socio (PID), día y hora.

Elementos de nombre de archivo CDF definidos

En la tabla siguiente se enumeran y definen los elementos de un nombre de CDF archivo.
Elemento Nombre de archivo Descripción
s3://aam-cdf/
Es el bloque de almacenamiento raíz predeterminado para el archivo CDF en un servidor Amazon S3.
su nombre de contenedor S3
Nombre del contenedor S3 de sólo lectura que contiene los archivos CDF.
day= yyyy-mm-dd
La fecha en que se procesó el archivo.
hour= hh
Un valor de hora expresado en notación de 24 horas y definido en la zona horaria UTC. Consulte también Tiempos del nombre del archivo de la fuente de datos del cliente y Tiempos del contenido del archivo....
ID del socio
Su ID de socio.
ID de proceso de AAM_0
Un ID de proceso interno de Audience Manager .
.gz
Extensión de archivo gzip. Los archivos CDF están comprimidos gzip.

Notificaciones de procesamiento de archivos de fuentes de datos de clientes

Audience Manager escribe un .info archivo en su S3 directorio para informarle cuando Customer Data File (CDF) esté listo para descargar. El .info archivo también incluye metadatos JSON formateados sobre el contenido de CDF los archivos. Consulte esta sección para obtener información sobre la sintaxis y los campos utilizados por este archivo de notificación.

Archivo de información de muestra

Cada .info archivo contiene una Files sección y Totals . La Files sección contiene una matriz que contiene métricas específicas para cada archivo por hora. La Totals sección contiene métricas agregadas en todos los CDF archivos para un día en particular. El contenido del .info archivo podría ser similar al del siguiente ejemplo.
{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Campos del archivo de información definidos

Las siguientes tablas enumeran y definen los elementos de un CDF .info archivo.

Objeto Files

Campo Descripción
Archivos
Inicia la matriz que contiene metadatos sobre los archivos CDF.
FileByteSize
Tamaño del archivo en bytes.
FileChecksumMD5
Amazon S3 ETag. El número que sigue al guión muestra el número de partes utilizadas para crear el archivo durante la carga de varias partes. La ETag no es idéntica a la suma de comprobación MD5 del archivo.
NombreDeArchivo
El nombre del archivo. Consulte Convenciones de nomenclatura de archivos de fuentes de datos de clientes.
FileSequenceNumber
Un número de índice para cada archivo.

Totals (objeto)

Campo Descripción
Totales
Inicia el objeto que contiene datos agregados sobre todos los archivos CDF.
Día
El día para el que están disponibles los datos. Utiliza el formato aaaa-mm-dd .
Hora
La hora para la que están disponibles los datos. Utiliza el formato de 24 horas establecido en la zona horaria UTC.
TotalByteSize
Tamaño total de todos los archivos CDF para esa fecha en bytes.
TotalNumberFiles
Número total de archivos cargados en el directorio S3.

Los tiempos del nombre del archivo de fuente de datos del cliente y del contenido del archivo son diferentes

El CDF archivo contiene marcas de hora en el nombre del archivo y en el contenido del archivo. Estas marcas de hora registran diferentes procesos de eventos para el mismo CDF archivo. No es raro ver marcas de hora diferentes en el nombre y el contenido del mismo archivo. El comprender cada marca de tiempo puede ayudarle a evitar errores comunes al trabajar con estos datos o al intentar ordenarlos por tiempo.

Localización de marcas de hora de archivo CDF

CDF los archivos registran el tiempo de forma diferente en dos ubicaciones distintas.

Diferencia entre marcas de hora

En la tabla siguiente se proporcionan detalles adicionales sobre las marcas de hora CDF del archivo, así como información sobre cómo utilizarlas correctamente.
Ubicación de marca de hora
Descripción
Nombre del archivo
La marca de tiempo en el nombre del archivo CDF marca la hora en la que Audience Manager comenzó a preparar el archivo para la entrega. Esta marca de hora se establece en la zona horaria UTC. Utiliza el hour= parámetro, con el formato de hora de 2 dígitos en notación de 24 horas. Esta hora puede ser diferente a la hora del evento registrada en el contenido del archivo. DesgloseAl trabajar con archivos CDF, a veces notará que su cubo S3 está vacío durante una hora en particular. Un depósito vacío significa cualquiera de los siguientes:
  • No hay datos para esa hora en particular.
  • Nuestros servidores están bajo cargas pesadas y no pueden procesar archivos durante una hora en particular. Cuando el servidor se pone al día, coloca los archivos que deberían haber pasado en un bloque de tiempo anterior en un bloque con un valor de tiempo posterior. Por ejemplo, verá esto cuando un archivo que debería estar en el bloque de hora 17 aparezca en el bloque de hora 18 (con hour=18 el nombre del archivo). En este caso, es probable que el servidor haya empezado a procesar el archivo en la hora 17, pero no pueda completarlo dentro de ese intervalo de tiempo. En su lugar, el archivo se inserta en el siguiente bloque de tiempo por hora.
Importante : No utilice la marca de tiempo del nombre del archivo para agrupar eventos por tiempo. Si necesita agrupar por tiempo, utilice la EventTime marca de tiempo en el contenido del archivo.
Contenido del archivo
La marca de tiempo del contenido del archivo CDF marca la hora en que los servidores de recopilación de datos comenzaron a procesar el archivo. Esta marca de hora se establece en la zona horaria UTC. Utiliza el EventTime campo, con el formato de tiempo yyyy-mm-dd hh:mm:ss . Esta hora está cerca de la hora real del evento en la página, pero puede ser diferente al indicador de hora en el nombre del archivo.
Sugerencia : A diferencia de la hour= marca de tiempo del nombre del archivo, puede utilizarla EventTime para agrupar los datos por tiempo.