Show Menu
SUJETS×

Customer Data Feeds

Informations de base sur Customer Data Feed (CDF) les fichiers et instructions de démarrage. Début ici si vous souhaitez recevoir CDF des fichiers ou simplement plus d'informations.

Contenu et objet du fichier

Un fichier CDF contient les mêmes données que celles envoyées à nos serveurs par un appel d’événement Audience Manager ( /event ). This includes data like user IDs, trait IDs, segment IDs, and all the other parameters captured by an event call. Les Audience Manager systèmes internes traitent les données de événement dans un CDF fichier dont le contenu est organisé en champs qui s’affichent dans un ordre défini. Audience Manager essaie de générer CDF des fichiers toutes les heures et de les stocker dans un compartiment sécurisé spécifique au client sur un Amazon S3 serveur. Nous fournissons ces fichiers pour que vous puissiez travailler avec Audience Manager des données en dehors des limites imposées par notre interface utilisateur.
Notez les restrictions suivantes lorsque vous utilisez des fichiers CDF :
  • Avant de configurer la diffusion de fichiers CDF, assurez-vous que vous disposez des autorisations appropriées de fournisseurs de données tiers pour l'exportation de caractéristiques tierces.
  • Vous ne devez pas utiliser CDF les fichiers comme proxy pour surveiller le trafic des pages, réconcilier les écarts de rapport ou pour la facturation, etc.

Prise en main

Il n'existe pas de processus en libre-service pour début de la diffusion de CDF fichiers. Contact your Audience Manager consultant or Customer Care to get started. Lors de la mise en oeuvre, votre Audience Manager représentant :
  • Configurez votre compartiment Amazon S3 enregistrement.
  • Fournissez des informations d’identification d’authentification en lecture seule S3 à votre compartiment d’enregistrement de fichiers. Vous ne pourrez ni afficher ni accéder aux répertoires et aux fichiers qui appartiennent à d’autres clients.
Les notifications de fichiers et CDF les fichiers s’affichent dans votre S3 compartiment lorsqu’ils sont prêts à être téléchargés. Vous êtes responsable de la surveillance et du téléchargement des fichiers à partir du S3 répertoire qui vous est attribué. Voir Notifications de traitement des fichiers de flux de données client .

Étapes suivantes

Les sections ci-dessous et la FAQ sur le flux de données client peuvent vous aider à mieux vous familiariser avec ce service.

Customer Data Feed Contenu défini

Liste et définit les éléments de données et les tableaux dans un CDF fichier, par ordre d’apparition. Les définitions incluent les types de données, mais ces informations ne font pas partie d’un CDF fichier.

Définitions

Un CDF fichier comprend certains ou tous les champs définis ci-dessous. Pour plus d’informations sur l’organisation interne des fichiers, voir Structure des fichiers de flux de données client.
Champ Type de données Description
Event Time
Horodatage
Heure à laquelle un fichier CDF a été traité par les serveurs de collecte de données (DCS) . L’horodatage utilise le format hh:mm:ss aaaa-mm-jj et est défini dans le fuseau horaire UTC.
Remarque : L'heure du Événement n'est pas :
  • Heure du événement de page ou de l’appel du événement lui-même, bien qu’elle puisse être proche de cette heure.
  • Lié à l’heure du serveur de collecte de données dans le nom de fichier. Voir aussi Heures pour le nom de fichier du flux de données du client et Heures pour le contenu du fichier... .
Device
Chaîne
Il s’agit de l’identifiant utilisateur unique (UUID), qui est un identifiant de périphérique à 38 chiffres pour le visiteur de votre site. Voir également Index des ID dans Audience Manager .
Container ID
Numérique
ID du conteneur qui déclenche la synchronisation des identifiants.
Realized Traits
Tableau numérique
Tableau d’identifiants de caractéristiques qui contient toutes les caractéristiques qu’un visiteur a prises en compte (pour lesquelles il est qualifié) dans l’appel de événement.
Notez que le tableau peut contenir des caractéristiques pour lesquelles le visiteur s'était qualifié avant et pour lesquelles il se réqualifie via cet appel de événement.
Realized Segments
Tableau numérique
Tableau d’ID de segment qui contient tous les segments qu’un visiteur a réalisés (pour lesquels il est qualifié) dans l’appel de événement.
Request Parameters
Chaîne
Chaîne qui capture tous les paramètres (variables, identifiants, paires clé-valeur, identifiants publicitaires de périphériques, etc.) transmis lors de l’appel de événement.
Exemple raccourci :
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
Chaîne
URL non codée de la page de référence (le cas échéant).
IP Data Type
Chaîne
Adresse IP du visiteur capturé dans l’appel de événement.
MCDevice
Chaîne
Identifiant Experience Cloud (MID) attribué au visiteur du site. Voir aussi Cookies et Service d’identité des Experience Platform Adobe.
All Segments
Tableau numérique
Tableau d’ID de segment contenant les segments précédemment réalisés et les nouveaux segments pour lesquels le visiteur est qualifié.
All Traits
Tableau numérique
Tableau d’identifiants de caractéristiques propriétaires et tiers contenant des caractéristiques précédemment réalisées et de nouvelles caractéristiques pour lesquelles le visiteur s’est qualifié depuis le dernier flux de données généré.

Customer Data Feed Structure du fichier

Liste et définit la structure de données d’un CDF fichier. Cela inclut la séquence de données, les délimiteurs de champ et les séparateurs, un mappage de fichier de données et un exemple de fichier.

Identifiants de champ de données et séquence

CDF ne contiennent pas de colonnes ou d’en-têtes de champ étiquetés. A la place, un CDF fichier définit des champs et des tableaux avec ASCII des caractères non imprimables. En outre, le fichier CDF liste chaque champ et tableau dans un ordre spécifique. La compréhension des identificateurs de champ et de l’ordre vous aidera à analyser correctement le fichier.
Elément de fichier CDF Description
Séparateurs de champs et délimiteurs
Ces caractères non imprimables définissent les éléments et la structure de votre fichier CDF :
  • Ctrl + a (ASCII 001 ou ^A ) sépare les données des champs individuels par un indicateur d’espace non imprimable.
  • Ctrl + b (ASCII 002 ou ^B ) sépare les données d'un tableau et les paramètres de requête.
  • Ctrl + c (ASCII 003 ou ^C ) définit des paires clé-valeur.
Séquence de champs
Important : Audience Manager se réserve le droit d'ajouter de nouveaux champs à la fin du fichier CDF dans les prochaines versions. Cela signifie que la conception technique de votre système d'analyse de fichiers ne doit pas supposer un nombre fixe de colonnes (bien qu'elle puisse supposer un ordre fixe pour les colonnes existantes).
Les données contenues dans votre fichier CDF s’affichent dans l’ordre indiqué ci-dessous.
  1. Heure du Événement
  2. Device
  3. ID de conteneur
  4. Caractéristiques réalisées
  5. Segments réalisés
  6. Paramètres de requête
  7. Referer
  8. Adresse IP
  9. ID de périphérique Experience Cloud (ou MID). See also, Cookies and the Adobe Experience Platform Identity Service
  10. Tous les segments
  11. Toutes les caractéristiques
Pour obtenir la description des champs, voir Définition du contenu du flux de données client.

CDF Carte de fichiers

CDF les données de fichier s’affichent dans l’ordre indiqué ci-dessous.

Identification des tableaux

Tableaux dans un début de CDF fichiers et se terminent par le séparateur de Ctrl + a champs. Ainsi, le premier élément d'un tableau apparaît comme un champ de données autonome. Par exemple, la traits baie de disques réalisée s'début avec ^A1234 . Le délimiteur et l'ID de tableau ^B5678 suivent cette entrée. Par conséquent, vous pouvez être tenté de penser que le premier élément du tableau réalisé traits est l'identifiant 5678 (car il début avec ^B ). Ce n’est pas le cas, c’est pourquoi vous devez connaître la séquence et la structure d’un fichier de données. Même si le premier élément du tableau réalisé trait (ou de l'un des autres tableaux d'un CDF fichier) s'début avec ^A , l'ordre d'apparence ou de position du fichier définit le début d'un tableau. Et le premier élément d'un tableau est toujours séparé de l'entrée précédente par ^A .

Sample CDF File

Un exemple de CDF fichier peut ressembler à ce qui suit. Nous avons inséré des sauts de ligne dans cet exemple pour l'aider à s'adapter à la page.

Customer Data Feed Conventions de dénomination des fichiers

Les sections ci-dessous liste et définissent les éléments de votre nom de CDF fichier.

CDF Nom du fichier : Syntaxe et exemple

Un nom de CDF fichier type contient les éléments répertoriés ci-dessous. Note, italics indicates a variable placeholder:

Syntaxe

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

Exemple

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

Dans votre regroupement d' S3 enregistrements, les fichiers sont triés par ordre croissant selon l'ID de partenaire (PID), le jour et l'heure.

CDF Définition des éléments de nom de fichier

Le tableau suivant liste et définit les éléments d’un nom de CDF fichier.
Elément Nom de fichier Description
s3://aam-cdf/
Il s’agit du compartiment d’enregistrement racine par défaut pour votre fichier CDF sur un serveur Amazon S3.
your S3 bucket name
Nom du compartiment S3 en lecture seule qui contient vos fichiers CDF.
day= yyyy-mm-dd
Date de traitement de votre fichier.
hour= hh
Valeur horaire exprimée en notation de 24 heures et définie dans le fuseau horaire UTC. Voir aussi Heures pour le nom de fichier du flux de données du client et Heures pour le contenu du fichier... .
partner ID
Votre identifiant de partenaire.
AAM process ID _0
ID de processus d’ Audience Manager interne.
.gz
Extension de fichier gzip. Les fichiers CDF sont compressés par gzip.

Customer Data Feed Notifications de traitement de fichiers

Audience Manager écrit un .info fichier dans votre S3 répertoire afin de vous indiquer quand votre Customer Data File (CDF) fichier est prêt pour le téléchargement. Le .info fichier comprend également des métadonnées JSON formatées sur le contenu de vos CDF fichiers. Consultez cette section pour en savoir plus sur la syntaxe et les champs utilisés par ce fichier de notification.

Exemple de fichier d'informations

Chaque .info fichier contient une Files section et Totals . La Files section contient un tableau contenant des mesures spécifiques pour chaque fichier horaire. La Totals section contient des mesures agrégées dans tous vos CDF fichiers pour un jour donné. Le contenu de votre .info fichier peut ressembler à l’exemple suivant.
{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Champs de fichier d'informations définis

Les tableaux suivants liste et définissent les éléments d’un CDF .info fichier.

Objet Fichiers

Champ Description
Files
Début la baie contenant des métadonnées sur vos fichiers CDF.
FileByteSize
Taille du fichier en octets.
FileChecksumMD5
L'Amazon S3 ETag. Le nombre suivant le trait d’union indique le nombre de pièces utilisées pour créer le fichier pendant le téléchargement en plusieurs parties. La valeur ETag n'est pas identique à la somme de contrôle MD5 du fichier.
FileName
FileSequenceNumber
Numéro d’index pour chaque fichier.

Totaux, objet

Champ Description
Totals
Début l’objet qui contient des données agrégées sur tous vos fichiers CDF.
Day
Jour de disponibilité des données. Utilise le format aaaa-mm-jj .
Hour
Heure pour laquelle les données sont disponibles. Utilise le format 24 heures défini dans le fuseau horaire UTC.
TotalByteSize
Taille totale de tous vos fichiers CDF pour cette date, en octets.
TotalNumberFiles
Nombre total de fichiers téléchargés dans votre répertoire S3.

Customer Data Feed Les heures des noms de fichier et les heures du contenu du fichier diffèrent

Votre CDF fichier contient des horodatages dans le nom de fichier et le contenu du fichier. Ces horodatages enregistrent différents processus de événement pour le même CDF fichier. Il n’est pas rare de voir des horodatages différents dans le nom et le contenu du même fichier. La compréhension de chaque horodatage peut vous aider à éviter les erreurs courantes lors de l’utilisation de ces données ou lors d’une tentative de tri temporel.

Localisation des horodatages des CDF fichiers

CDF les fichiers enregistrent le temps différemment en 2 emplacements distincts.

Comprendre la différence entre les horodatages

Le tableau suivant fournit des détails supplémentaires sur les horodatages de vos CDF fichiers, ainsi que des informations sur leur utilisation correcte.
Emplacement de l’horodatage
Description
Nom de fichier
L’horodatage du nom de votre CDF fichier marque l’heure à laquelle Audience Manager vous avez commencé à préparer votre fichier pour la diffusion. Cet horodatage est défini dans le UTC fuseau horaire. Il utilise le hour= paramètre, avec l’heure formatée comme une heure à 2 chiffres en notation à 24 heures. Cette heure peut être différente de l’heure de événement enregistrée dans le contenu du fichier. Lorsque vous travaillez avec CDF des fichiers, vous remarquerez parfois que votre S3 compartiment est vide pendant une heure donnée. Un compartiment vide peut signifier l’une des significations suivantes :
  • Il n'y a pas de données pour cette heure particulière.
  • Nos serveurs sont sous de lourdes charges et ne peuvent pas traiter les fichiers pendant une heure particulière. Lorsque le serveur récupère, il place les fichiers qui auraient dû être transférés dans un intervalle de temps antérieur dans un intervalle de temps avec une valeur d'heure ultérieure. Par exemple, vous verrez ceci lorsqu'un fichier qui aurait dû être dans la corbeille 17 heures apparaît dans la corbeille 18 heures (avec hour=18 le nom de fichier). Dans ce cas, le serveur a probablement commencé à traiter votre fichier à l’heure 17, mais n’a pas pu le terminer dans cet intervalle. Au lieu de cela, le fichier est déplacé vers l’intervalle horaire suivant.
Important : N’utilisez pas l’horodatage du nom de fichier pour regrouper les événements par heure. Si vous devez grouper par heure, utilisez l’ EventTime horodatage dans le contenu du fichier.
Contenu du fichier
L’horodatage du contenu du CDF fichier marque l’heure à laquelle le Data Collection Servers traitement du fichier a commencé. Cet horodatage est défini dans le UTC fuseau horaire. Il utilise le EventTime champ, avec l’heure yyyy-mm-dd hh:mm:ss formatée. Cette heure est proche de l’heure réelle du événement sur la page, mais elle peut être différente de l’indicateur d’heure dans le nom de fichier.
Conseil : Contrairement à l’ hour= horodatage du nom de fichier, vous pouvez utiliser EventTime pour regrouper les données par heure.