Show Menu
THEMEN×

Kundendatenfeeds

Grundlegende Informationen zu Customer Data Feed (CDF) Dateien und Anleitungen zum Einstieg. Beginnen Sie hier, wenn Sie an CDF Dateien interessiert sind oder einfach mehr Informationen benötigen.

Dateiinhalt und Zweck

Eine CDF Datei enthält dieselben Daten, die ein Audience Manager Ereignisaufruf ( /event ) an unsere Server sendet. Dazu gehören Daten wie Benutzer-IDs, Eigenschaften-IDs, Segment-IDs und alle anderen Parameter, die von einem Ereignisaufruf erfasst werden. Interne Audience Manager Systeme verarbeiten Ereignisdaten in einer CDF Datei, deren Inhalt in Felder unterteilt ist, die in einer bestimmten Reihenfolge angezeigt werden. Audience Manager versucht, CDF Dateien stündlich zu generieren und speichert sie in einem sicheren, kundenspezifischen Behälter auf einem Amazon S3 Server. Wir stellen diese Dateien zur Verfügung, damit Sie mit Audience Manager Daten arbeiten können, die nicht den durch unsere Benutzeroberfläche festgelegten Beschränkungen unterliegen.
Sie sollten keine CDF Dateien als Proxy verwenden, um den Seitenverkehr zu überwachen, Berichtsdiskrepanzen zu überwinden, Abrechnungen usw. vorzunehmen.

Erste Schritte

Es gibt keinen Selbstbedienungsprozess, um die CDF Dateibereitstellung zu starten. Contact your Audience Manager consultant or Customer Care to get started. Während der Implementierung wird Ihr Audience Manager Vertreter:
  • Richten Sie den Amazon S3 Speicherbehälter ein.
  • Geben Sie Ihrem Dateispeicherbehälter schreibgeschützte S3 Authentifizierungsberechtigungen an. Sie können keine Ordner und Dateien anderer Kunden anzeigen oder darauf zugreifen.
Dateibenachrichtigungen und CDF -dateien werden in Ihrem S3 Bucket angezeigt, sobald sie zum Download bereit sind. Sie sind für die Überwachung und das Herunterladen von Dateien aus Ihrem zugewiesenen S3 Verzeichnis verantwortlich. Siehe Benachrichtigungen zur Verarbeitung von Kundendaten-Feed-Dateien .

Nächste Schritte

Die folgenden Abschnitte und die häufig gestellten Fragen zum Kundendatenfeed helfen Ihnen, sich mit diesem Dienst vertraut zu machen.

Benutzerdaten-Feed-Inhalt definiert

Listet die Datenelemente und Arrays in einer CDF Datei in der Reihenfolge ihres Aussehens auf und definiert sie. Definitionen umfassen Datentypen, aber diese Informationen sind nicht Teil einer CDF Datei.

Definitionen

Eine CDF Datei enthält einige oder alle unten definierten Felder. Informationen zur internen Dateiorganisation finden Sie unter Struktur der Kundendaten-Feed-Datei .
Feld Datentyp Beschreibung
Ereigniszeit
Zeitstempel
Der Zeitpunkt, zu dem eine CDF-Datei von den Datenerfassungsservern verarbeitet wurde. Der Zeitstempel verwendet das Format yyyy-mm-dd hh:mm:ss und wird in der UTC-Zeitzone eingestellt.
Hinweis: Die Ereigniszeit ist nicht :
  • Der Zeitpunkt des Seitenereignisses oder des Ereignisaufrufs selbst, auch wenn er in der Nähe dieser Zeiten liegen kann.
  • Im Zusammenhang mit der DCS-Stunde im Dateinamen. Siehe auch Zeiten für Kundendaten-Feed-Dateien und Zeiten für Dateiinhalte....
Gerät
Zeichenfolge
Dies ist die Unique User ID (UUID), eine 38-stellige Geräte-ID für Ihren Site-Besucher. Weitere Informationen finden Sie unter Index of IDs in Audience Manager .
Behälter-ID
Numerisch
Die ID des Containers, der ID auslöst, wird synchronisiert.
Realisierte Eigenschaften
Numerisches Array
Ein Array von Eigenschaften-IDs, die alle Eigenschaften enthalten, die ein Besucher im Ereignisaufruf implementiert (qualifiziert) hat.
Beachten Sie, dass das Array Eigenschaften enthalten kann, für die sich der Besucher zuvor qualifiziert hatte und für die er sich durch diesen Ereignisaufruf erneut qualifiziert hat.
Realisierte Segmente
Numerisches Array
Ein Array von Segment-IDs, die alle Segmente enthalten, die ein Besucher im Ereignisaufruf (qualifiziert) durchgeführt hat.
Anfrageparameter
Zeichenfolge
Eine Zeichenfolge, die alle Parameter erfasst (Variablen, IDs, Schlüssel-Wert-Paare, Anzeigen-IDs für Geräte usw.) beim Ereignisaufruf weitergegeben.
Kurzes Beispiel:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.did:92D56353-49C5-431E-B474-FC528D585810,c_contextData a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Typ der Referrer-Daten
Zeichenfolge
Die nicht kodierte URL der verweisenden Seite (sofern vorhanden).
IP-Datentyp
Zeichenfolge
Die IP-Adresse des Besuchers, der im Ereignisaufruf erfasst wurde.
MCDevice
Zeichenfolge
Die Experience Cloud ID (MID), die dem Site-Besucher zugewiesen ist. See also, Cookies and theExperience Cloud ID service .
Alle Segmente
Numerisches Array
Ein Array von Segment-IDs, die zuvor realisierte Segmente und neue Segmente enthalten, für die der Besucher qualifiziert ist.
Alle Eigenschaften
Numerisches Array
Ein Array von Eigenschaften-IDs von Erstanbietern und Drittanbietern, die zuvor realisierte Eigenschaften und neue Eigenschaften enthalten, für die sich der Besucher seit dem letzten generierten Datenfeed qualifiziert hat.

Struktur der Benutzerdaten-Feed-Datei

Listet die Datenstruktur einer CDF Datei auf und definiert sie. Dazu gehören Datensequenzen, Feldtrennzeichen und Trennzeichen, eine Datendateizuordnung und eine Musterdatei.

Datenfeldkennungen und -sequenz

CDF Dateien enthalten keine gekennzeichneten Spalten oder Feldkopfzeilen. Stattdessen definiert eine CDF Datei Felder und Arrays mit nicht druckbaren ASCII Zeichen. Die CDF Datei listet außerdem jedes Feld und Array in einer bestimmten Reihenfolge auf. Anhand der Feldkennungen und der Reihenfolge können Sie die Datei richtig analysieren.
CDF-Dateielement Beschreibung
Feldtrennzeichen und Trennzeichen
Diese nicht druckbaren Zeichen definieren die Elemente und die Struktur Ihrer CDF-Datei:
  • Strg + A (ASCII 001 oder ^ A ) trennt Daten in einzelnen Feldern mit einem nicht druckbaren Leerzeichen.
  • Strg+b (ASCII 002 oder ^ B ) trennt Daten, Array- und Anforderungsparameter.
  • Strg + C (ASCII 003 oder ^ C ) definiert Schlüssel/Wert-Paare.
Feldsequenz
Wichtig: Audience Manager behält sich das Recht vor, neue Felder am Ende der CDF-Datei in zukünftigen Versionen hinzuzufügen. Das bedeutet, dass das technische Design Ihres Dateianalysesystems keine feste Anzahl von Spalten annehmen sollte (obwohl es eine feste Reihenfolge für vorhandene Spalten annehmen kann).
Daten in Ihrer CDF-Datei werden in der unten stehenden Reihenfolge angezeigt.
  1. Ereigniszeit
  2. Gerät
  3. Behälter-ID
  4. Realisierte Eigenschaften
  5. Realisierte Segmente
  6. Anfrageparameter
  7. Referer
  8. IP-Adresse
  9. Experience Cloud-Geräte-ID (oder MID). See also, Cookies and the Experience Cloud ID Service
  10. Alle Segmente
  11. Alle Eigenschaften
Feldbeschreibungen finden Sie unter Inhalt des Kundendatenfeeds definiert .

CDF-Dateizuordnung

CDF Dateidaten werden in der unten stehenden Reihenfolge angezeigt.

Identifizieren von Arrays

Arrays in einer CDF Datei beginnen und enden mit dem Ctrl + a Feldtrenner. Dadurch wird das erste Element in einem Array wie ein eigenständiges Datenfeld angezeigt. Das Array der realisierten Eigenschaften beginnt beispielsweise mit ^A1234 . Das Array-Trennzeichen und die ID ^B5678 folgen diesem Eintrag. Daher könnten Sie glauben, dass das erste Element im Array der realisierten Eigenschaften ID 5678 ist (da es mit ^B beginnt). Dies ist nicht der Fall, weshalb Sie mit der Reihenfolge und Struktur einer Datendatei vertraut sein müssen. Auch wenn das erste Element im realisierten Eigenschaftenarray (oder einem der anderen Arrays in einer CDF Datei) mit beginnt ^A , definiert die Reihenfolge des Erscheinungsbilds oder der Position in der Datei den Anfang eines Arrays. Und das erste Element in einem Array wird immer vom vorherigen Eintrag durch ^A getrennt.

Beispiel-CDF-Datei

Eine Beispieldatei CDF könnte wie folgt aussehen. Wir haben Zeilenumbrüche in dieses Beispiel eingefügt, um es an die Seite anzupassen.

Benennungskonventionen für Kundendatenfeed-Dateien

In den folgenden Abschnitten werden die Elemente in Ihrem CDF Dateinamen aufgelistet und definiert.

CDF-Dateiname: Syntax und Beispiel

Ein typischer CDF Dateiname enthält die unten aufgeführten Elemente. Note, italics indicates a variable placeholder:

Syntax

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

Beispiel

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

In Ihrem S3 Speicherbehälter werden die Dateien in aufsteigender Reihenfolge nach Partner-ID (PID), Tag und Stunde sortiert.

CDF-Dateinamenelemente definiert

In der folgenden Tabelle sind die Elemente in einem CDF Dateinamen aufgeführt und definiert.
Dateinamenelement Beschreibung
s3://aam-cdf/
Dies ist der standardmäßige Stammspeicherbehälter für Ihre CDF-Datei auf einem Amazon S3-Server.
Name des S3-Behälters
Der Name des schreibgeschützten S3-Behälters, der Ihre CDF-Dateien enthält.
day= yyyy-mm-dd
Das Datum, an dem Ihre Datei verarbeitet wurde.
hour= hh
Ein Zeitwert, der in 24-Stunden-Notation ausgedrückt und in der UTC-Zeitzone eingestellt wird. Siehe auch Zeiten für Kundendaten-Feed-Dateien und Zeiten für Dateiinhalte....
Partner-ID
Ihre Partner-ID.
AAM-Prozess-ID _0
Eine interne Audience Manager -Prozess-ID.
.gz
Eine gzip-Dateierweiterung. CDF-Dateien werden gzip-komprimiert.

Benachrichtigungen zur Verarbeitung von Daten-Feeds

Audience Manager schreibt eine .info Datei in Ihr S3 Verzeichnis, um Sie darüber zu informieren, wann Customer Data File (CDF) zum Download bereit ist. Die .info Datei enthält auch JSON formatierte Metadaten zum Inhalt Ihrer CDF Dateien. In diesem Abschnitt finden Sie Informationen zur Syntax und den Feldern, die von dieser Benachrichtigungsdatei verwendet werden.

Beispielinformationsdatei

Jede .info Datei enthält einen Files und einen Totals -Abschnitt. Der Files Abschnitt enthält ein Array, das für jede stündliche Datei spezifische Metriken enthält. Der Totals Abschnitt enthält Metriken, die an einem bestimmten Tag in all Ihren CDF Dateien aggregiert werden. Der Inhalt Ihrer .info Datei könnte dem folgenden Beispiel ähneln.
{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Felder für Infodateien definiert

In den folgenden Tabellen werden die Elemente in einer CDF .info Datei aufgelistet und definiert.

Dateiobjekt

Feld Beschreibung
Dateien
Startet das Array, das Metadaten zu Ihren CDF-Dateien enthält.
FileByteSize
Dateigröße in Byte.
FileChecksumMD5
Der Amazon S3 ETag. Die Zahl nach dem Bindestrich zeigt die Anzahl der Teile, die zum Erstellen der Datei während des mehrteiligen Uploads verwendet wurden. Das ETag ist nicht identisch mit der MD5-Prüfsumme der Datei.
FileName
FileSequenceNumber
Eine Indexnummer für jede Datei.

Gesamtobjekt

Feld Beschreibung
Gesamt
Startet das Objekt, das aggregierte Daten zu allen CDF-Dateien enthält.
Tag
Der Tag, an dem die Daten verfügbar sind. Verwendet das Format yyyy-mm-dd .
Stunde
Die Stunde, für die Daten verfügbar sind. Verwendet das 24-Stunden-Format, das in der UTC-Zeitzone festgelegt ist.
TotalByteSize
Gesamtgröße aller CDF-Dateien für dieses Datum in Byte.
TotalNumberFiles
Gesamtanzahl der Dateien, die in Ihren S3-Ordner hochgeladen wurden.

Die Uhrzeiten für den Kundendatenfeed-Dateinamen und die Dateiinhaltszeiten sind unterschiedlich

Ihre CDF Datei enthält Zeitstempel im Dateinamen und im Dateiinhalt. Diese Zeitstempel zeichnen unterschiedliche Ereignisprozesse für dieselbe CDF Datei auf. Es ist nicht ungewöhnlich, dass unterschiedliche Zeitstempel im Namen und Inhalt derselben Datei angezeigt werden. Die Kenntnis jedes Zeitstempels kann Ihnen dabei helfen, gängige Fehler beim Arbeiten mit diesen Daten oder beim Versuch, sie nach Zeit zu sortieren, zu vermeiden.

Suchen von CDF-Datei-Zeitstempeln

CDF -Dateien die Zeit in zwei verschiedenen Speicherorten unterschiedlich aufzeichnen.

Die Unterschiede zwischen Zeitstempeln

Die folgende Tabelle enthält weitere Details zu Ihren CDF Datei-Zeitstempeln sowie Informationen zur ordnungsgemäßen Verwendung.
Zeitstempelposition
Beschreibung
Dateiname
Der Zeitstempel im Namen der CDF-Datei kennzeichnet den Zeitpunkt, zu dem die Bereitstellung der Datei vorbereitet Audience Manager wurde. Dieser Zeitstempel wird in der UTC-Zeitzone eingestellt. Es verwendet den hour= Parameter, wobei die Uhrzeit als 2-stellige Stunde in 24-Stunden-Notation formatiert wird. Diese Zeit kann sich von der in den Dateiinhalten aufgezeichneten Ereigniszeit unterscheiden. BREAKWbeim Arbeiten mit CDF-Dateien werden Sie manchmal bemerken, dass Ihr S3-Behälter für eine bestimmte Stunde leer ist. Ein leerer Behälter bedeutet:
  • Es gibt keine Daten für diese bestimmte Stunde.
  • Unsere Server sind unter hoher Belastung und können keine Dateien für eine bestimmte Stunde verarbeiten. Wenn der Server erfasst, werden die Dateien, die in früheren Zeitbehälterdateien enthalten sein sollten, in einen Behälter mit einem späteren Zeitwert gelegt. Dies wird beispielsweise angezeigt, wenn eine Datei, die im 17-Stunden-Bucket enthalten sein sollte, im 18-Stunden-Bucket (mit hour=18 dem Dateinamen) angezeigt wird. In diesem Fall hat der Server wahrscheinlich die Verarbeitung der Datei in Stunde 17 begonnen, konnte sie jedoch nicht innerhalb dieses Zeitintervalls abschließen. Stattdessen wird die Datei in den nächsten Stundenzähler verschoben.
Wichtig : Verwenden Sie nicht den Zeitstempel für Dateinamen, um Ereignisse nach Zeit zu gruppieren. Wenn Sie nach Zeit gruppieren müssen, verwenden Sie den EventTime Zeitstempel im Dateiinhalt.
Dateiinhalt
Der Zeitstempel im Inhalt der CDF-Datei kennzeichnet den Zeitpunkt, zu dem die Datenerfassungsserver mit der Verarbeitung der Datei begonnen haben. Dieser Zeitstempel wird in der UTC-Zeitzone eingestellt. Es verwendet das EventTime Feld, wobei die Uhrzeit als yyyy-mm-dd hh:mm:ss . Diese Zeit ist nahe an der tatsächlichen Zeit des Ereignisses auf der Seite, kann jedoch von der Stundenanzeige im Dateinamen abweichen.
Tipp : Im Gegensatz zum hour= Zeitstempel im Dateinamen können Sie Daten nach Zeit gruppieren EventTime lassen.