Customer Data Feeds customer-data-feeds
Información básica sobre Customer Data Feed (CDF) archivos e instrucciones sobre cómo empezar. Comience aquí si está interesado en recibir CDF archivos o simplemente desea obtener más información.
Contenido y propósito del archivo file-contents-purpose
Un archivo CDF contiene los mismos datos que una llamada de evento de Audience Manager (/event
) envía a nuestros servidores. Esto incluye datos como ID de usuario, trait IDs, segment IDsy todos los demás parámetros capturados por una llamada de evento. Interno Audience Manager procesa los datos de evento en una CDF archivo con contenido organizado en campos que aparecen en un orden definido. Audience Manager intenta generar CDF archivos por hora y los almacena en un espacio seguro y específico del cliente en un Amazon S3 servidor. Proporcionamos estos archivos para que pueda trabajar con Audience Manager datos fuera de los límites impuestos por nuestra interfaz de usuario.
- Antes de configurar la entrega de archivos CDF, asegúrese de que dispone de los permisos adecuados de los proveedores de datos de terceros para la exportación de características de terceros. Actualmente, Audience Manager no admite la funcionalidad en la interfaz de usuario para solicitar a los proveedores de datos de terceros el permiso de exportación de entrega de archivos CDF, por lo que debe ponerse en contacto con ellos de forma independiente.
- No debe utilizar CDF archivos como proxy para controlar el tráfico de la página, reconciliar discrepancias de informes, o para facturación, etc.
Introducción getting-started
No hay ningún proceso de autoservicio para iniciar CDF envío de archivos. Póngase en contacto con su Audience Manager consultor o con el Servicio de atención al cliente para empezar. Durante la implementación, su Audience Manager el representante:
- Configure su Amazon S3 cubo de almacenamiento.
- Proporcionar solo lectura S3 credenciales de autenticación en el contenedor de almacenamiento de archivos. No podrá ver ni acceder a directorios y archivos que pertenezcan a otros clientes.
Notificaciones de archivos y CDF Los archivos aparecerán en su S3 cubos cuando estén listos para descargar. Usted es responsable de supervisar y descargar archivos de su asignado S3 directorio. Consulte Notificaciones sobre procesamiento de archivos de fuentes de datos de clientes.
Pasos siguientes next-steps
Las secciones siguientes y la Preguntas frecuentes sobre fuentes de datos de clientes puede ayudarle a familiarizarse con este servicio.
Customer Data Feed Contenido definido cdf-defined
Enumera y define los elementos de datos y las matrices de una CDF archivo, por orden de aparición. Las definiciones incluyen tipos de datos, pero esta información no forma parte de un CDF archivo.
Definiciones definitions
A CDF incluye algunos o todos los campos definidos a continuación. Para obtener información sobre la organización interna de archivos, consulte Estructura de archivo de fuente de datos del cliente.
Event Time
Hora a la que el administrador procesó un archivo CDF Servidores de recopilación de datos (DCS). La marca de tiempo utiliza el yyyy-mm-dd hhss y se establece en la zona horaria UTC.
Nota: La Hora Del Evento no es:
- La hora del evento de página o la propia llamada de evento, aunque puede estar cerca de esas horas.
- Relacionado con la hora DCS en el nombre de archivo. Consulte también. Fuentes de datos del cliente Nombre de archivo Horas y Contenido de archivo Horas....
Device
Container ID
Realized Traits
Una matriz de ID de rasgos que contiene todos los rasgos para los que un visitante se dio cuenta (cualificado) en la llamada de evento.
Tenga en cuenta que la matriz puede contener características para las que el visitante había cumplido los requisitos antes y para las que volvió a clasificarse a través de esta llamada de evento.
Realized Segments
Request Parameters
Una cadena que captura todos los parámetros (variables, ID, pares clave-valor, ID de publicidad de dispositivo, etc.) pasado en la llamada de evento.
Ejemplo abreviado:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
MCDevice
All Segments
All Traits
Customer Data Feed Estructura de archivos cdf-file-structure
Enumera y define la estructura de datos de un CDF archivo. Esto incluye la secuencia de datos, los delimitadores y separadores de campo, un mapa del archivo de datos y un archivo de muestra.
Identificadores y secuencia de campos de datos identifiers-and-sequence
CDF los archivos no contienen columnas etiquetadas ni encabezados de campo. En su lugar, un CDF define campos y matrices con elementos no imprimibles ASCII caracteres. Además, la variable CDF El archivo enumera cada campo y matriz en un orden específico. Comprender los identificadores de campo y el orden le ayudará a analizar el archivo correctamente.
Estos caracteres no imprimibles definen los elementos y la estructura del archivo CDF:
- Ctrl + a (ASCII)
001
o^A
) separa los datos de campos individuales con un indicador de espacio no imprimible. - Ctrl + b (ASCII)
002
o^B
) separa los datos de una matriz y los parámetros de solicitud. - Ctrl + c (ASCII)
003
o^C
) define pares clave-valor.
Importante: Audience Manager se reserva el derecho de añadir nuevos campos al final del archivo CDF en futuras versiones. Esto significa que el diseño técnico del sistema de análisis de archivos no debe suponer un número fijo de columnas (aunque puede suponer un orden fijo para las columnas existentes).
Los datos del archivo CDF aparecen en el orden indicado a continuación. /N puede aparecer en lugar de cualquiera de estos campos, lo que indica un valor nulo.
- Hora del evento
- Device
- ID de contenedor
- Características realizadas
- Segmentos realizados
- Parámetros de solicitud
- Referer
- Dirección IP
- ID del dispositivo del Experience Cloud (o MID). Consulte también. Cookies y el servicio de Adobe Experience Platform ID
- Todos los segmentos
- Todas las características
Para ver las descripciones de los campos, consulte Contenido de fuente de datos de cliente definido.
CDF Mapa de archivos cdf-file-map
CDF los datos del archivo aparecen en el orden mostrado a continuación.
Identificación de matrices
Matrices en una CDF inicio y final del archivo con Ctrl + a
separador de campos. Esto hace que el primer elemento de una matriz parezca un campo de datos independiente. Por ejemplo, la cuenta traits la matriz empieza por ^A1234
. El delimitador de matriz y el ID ^B5678
sigue esta entrada. Como resultado, puede sentirse tentado a pensar que el primer elemento de la imagen realizada traits La matriz es el ID 5678 (porque comienza con ^B
). Este no es el caso, por lo que debe estar familiarizado con la secuencia y estructura de un archivo de datos. A pesar de que el primer elemento en el realizado trait matriz (o cualquiera de las otras matrices de una CDF file) empieza por ^A
, el orden de aparición o posición en el archivo define el inicio de una matriz. Y, el primer elemento de una matriz siempre se separa de la entrada anterior por ^A
.
Muestra CDF Archivo sample-file
Una muestra CDF podría tener un aspecto similar al siguiente. Hemos insertado saltos de línea en este ejemplo para que se ajuste a la página.
Customer Data Feed Convenciones de nomenclatura de archivos cdf-naming-conventions
Las secciones siguientes enumeran y definen los elementos de su CDF nombre de archivo.
CDF Nombre del archivo: sintaxis y ejemplo cdf-file-name
Un típico CDF file name contiene los elementos que se enumeran a continuación. Nota, cursiva indica un marcador de posición variable:
Sintaxis
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
Ejemplo
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
En su S3 , los archivos se ordenan en orden ascendente por ID de socio (PID), día y hora.
CDF Elementos de nombre de archivo definidos cdf-file-name-elements
En la tabla siguiente se enumeran y definen los elementos de una CDF nombre de archivo.
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed Notificaciones de procesamiento de archivos cdf-file-processing-notifications
Audience Manager escribe un .info
archivo a su S3 directorio para que sepa cuándo Customer Data File (CDF) está listo para descargar. El .info
el archivo también incluye JSON metadatos con formato sobre el contenido de su CDF archivos. Revise esta sección para obtener información sobre la sintaxis y los campos utilizados por este archivo de notificación.
Archivo de información de muestra sample-info-file
Cada .info
el archivo contiene un Files
y Totals
sección. El Files
contiene una matriz que contiene métricas específicas para cada archivo por hora. El Totals
contiene métricas agregadas en todas sus CDF archivos de un día en particular. El contenido de su .info
podría ser similar al siguiente ejemplo.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Campos de archivo de información definidos info-file-fields-defined
Las siguientes tablas enumeran y definen los elementos de una CDF .info
archivo.
Objeto Files
Files
FileByteSize
FileChecksumMD5
ETag
no es idéntico a la suma de comprobación MD5 del archivo.FileName
FileSequenceNumber
Objeto Totals
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed Las horas del nombre del archivo y las horas del contenido del archivo son diferentes different-processing-times
Su CDF el archivo contiene marcas de hora en su nombre y contenido. Estas marcas de tiempo registran diferentes procesos de evento para el mismo CDF archivo. No es raro ver marcas de tiempo diferentes en el nombre y el contenido del mismo archivo. Comprender cada marca de tiempo puede ayudarle a evitar errores comunes al trabajar con estos datos o al intentar ordenarlos por tiempo.
Localización CDF Marcas horarias de archivo locating-timestamps
CDF Los archivos registran el tiempo de forma diferente en dos ubicaciones independientes.
Explicación de la diferencia entre marcas de tiempo understanding-timestamps
La siguiente tabla proporciona detalles adicionales sobre su CDF las marcas de tiempo de los archivos, junto con información sobre cómo utilizarlas correctamente.
La marca de tiempo de su CDF nombre de archivo marca la hora en que Audience Manager comenzó a preparar el archivo para su envío. Esta marca de tiempo se establece en UTC zona horaria. Utiliza el hour=
, con el formato de hora de 2 dígitos en notación de 24 horas. Esta hora puede ser diferente a la hora del evento registrada en el contenido del archivo. Al trabajar con CDF archivos, a veces notará que su S3 el bloque está vacío durante una hora en particular. Un bloque vacío significa que puede significar cualquiera de las siguientes opciones:
- No hay datos para esa hora en particular.
- Nuestros servidores están bajo cargas pesadas y no pueden procesar archivos durante una hora en particular. Cuando el servidor se pone al día, coloca los archivos que deberían haber estado en un bloque de tiempo anterior en un bloque con un valor de tiempo posterior. Por ejemplo, verá esto cuando aparezca un archivo que debería haber estado en el bloque de horas 17 en el bloque de horas 18 (con
hour=18
en el nombre del archivo). En este caso, es probable que el servidor haya empezado a procesar el archivo en la hora 17, pero no haya podido completarlo en ese intervalo de tiempo. En su lugar, el archivo se inserta en el siguiente bloque de tiempo por hora.
Importante: no utilice la marca de tiempo del nombre de archivo para agrupar eventos por tiempo. Si necesita agrupar por tiempo, utilice el EventTime
marca de tiempo en el contenido del archivo.
EventTime
, con el formato de hora yyyy-mm-dd hh:mm:ss
. Esta hora está cerca de la hora real del evento en la página, pero puede ser diferente al indicador de hora del nombre del archivo.Sugerencia: A diferencia del
hour=
marca de tiempo en el nombre del archivo, puede utilizar EventTime
para agrupar los datos por tiempo.