Show Menu
THEMEN×

Customer Data Feeds

Grundlegende Informationen zu Customer Data Feed (CDF) Dateien und Anleitungen zum Einstieg. Beginn hier, wenn Sie an CDF Dateien interessiert sind oder einfach mehr Informationen benötigen.

Dateiinhalt und Zweck

Eine CDF-Datei enthält dieselben Daten, die ein Audience Manager-Ereignisaufruf ( /event ) an unsere Server sendet. This includes data like user IDs, trait IDs, segment IDs, and all the other parameters captured by an event call. Interne Audience Manager Systeme verarbeiten Ereignis-Daten in einer CDF Datei, deren Inhalt in einer bestimmten Reihenfolge angeordnet ist. Audience Manager versucht, CDF Dateien stündlich zu generieren und speichert sie in einem sicheren, kundenspezifischen Behälter auf einem Amazon S3 Server. Wir stellen diese Dateien zur Verfügung, damit Sie mit Audience Manager Daten arbeiten können, die nicht den durch unsere Benutzeroberfläche festgelegten Beschränkungen unterliegen.
Beachten Sie beim Arbeiten mit CDF-Dateien die folgenden Einschränkungen:
  • Bevor Sie CDF-Datei-Versand einrichten, vergewissern Sie sich bitte, dass Sie über die entsprechenden Berechtigungen von Drittanbietern für den Export von Eigenschaften von Drittanbietern verfügen. Audience Manager unterstützt derzeit keine Funktionen in der Benutzeroberfläche, mit denen die Exportgenehmigung für CDF-Versand von Drittanbietern angefordert werden kann. Bitte wenden Sie sich daher unabhängig an sie.
  • Sie sollten keine CDF Dateien als Proxy verwenden, um den Seitenverkehr zu überwachen, Berichtsdiskrepanzen zu überwinden, Abrechnungen usw. vorzunehmen.

Erste Schritte

Es gibt keinen Self-Service-Vorgang für Beginn CDF File Versand. Contact your Audience Manager consultant or Customer Care to get started. Während der Implementierung wird Ihr Audience Manager Vertreter:
  • Richten Sie Ihren Amazon S3 Datenspeicherung-Behälter ein.
  • Geben Sie Ihrem Dateipaket S3 für die Datenspeicherung schreibgeschützte Authentifizierungsberechtigungen an. Sie können keine Ordner und Dateien anderer Kunden anzeigen oder darauf zugreifen.
Dateibenachrichtigungen und CDF -dateien werden in Ihrem S3 Bucket angezeigt, sobald sie zum Download bereit sind. Sie sind für die Überwachung und das Herunterladen von Dateien aus Ihrem zugewiesenen S3 Verzeichnis verantwortlich. Siehe Verarbeitungsbenachrichtigungen für CDF-Dateien .

Nächste Schritte

Die folgenden Abschnitte und die häufig gestellten Fragen zum Kundendatenfeed können Ihnen dabei helfen, sich mit diesem Dienst vertraut zu machen.

Customer Data Feed Definierte Inhalte

Listen und definiert die Datenelemente und Arrays in einer CDF Datei in der Reihenfolge ihres Erscheinungsbilds. Definitionen umfassen Datentypen, aber diese Informationen sind nicht Teil einer CDF Datei.

Definitionen

Eine CDF Datei enthält einige oder alle unten definierten Felder. Informationen zur internen Dateiorganisation finden Sie unter Struktur der Kundendaten-Feed-Datei .
Feld Datentyp Beschreibung
Event Time
Zeitstempel
Der Zeitpunkt, zu dem eine CDF-Datei von den Datenerfassungsservern verarbeitet wurde. Der Zeitstempel verwendet das Format yyyy-mm-dd hh:mm:ss und wird in der UTC-Zeitzone eingestellt.
Hinweis: Die Ereignis-Zeit ist nicht :
Device
Zeichenfolge
Dies ist die Unique User ID (UUID), eine 38-stellige Geräte-ID für Ihren Site-Besucher. Weitere Informationen finden Sie unter Index of IDs in Audience Manager .
Container ID
Numerisch
Die ID des Containers, der ID auslöst, wird synchronisiert.
Realized Traits
Numerisches Array
Ein Array von Eigenschaften-IDs, die alle Eigenschaften enthalten, die ein Besucher im Ereignis-Aufruf implementiert (qualifiziert für) hat.
Beachten Sie, dass das Array Eigenschaften enthalten kann, für die sich der Besucher zuvor qualifiziert hatte und für die sie sich durch diesen Ereignis-Aufruf erneut qualifizieren.
Realized Segments
Numerisches Array
Ein Array von Segment-IDs, die alle Segmente enthalten, die ein Besucher im Ereignis-Aufruf implementiert (qualifiziert) hat.
Request Parameters
Zeichenfolge
Eine Zeichenfolge, die alle Parameter erfasst (Variablen, IDs, Schlüssel-Wert-Paare, Anzeigen-IDs für Geräte usw.) im Ereignis-Aufruf weitergegeben.
Kurzes Beispiel:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
Zeichenfolge
Die nicht kodierte URL der verweisenden Seite (sofern vorhanden).
IP Data Type
Zeichenfolge
Die IP-Adresse für den Besucher, der im Ereignis-Aufruf erfasst wird.
MCDevice
Zeichenfolge
Die dem Site-Besucher zugewiesene Experience Cloud -ID (MID). Siehe auch Cookies und den Adobe Experience Platform Identity Service .
All Segments
Numerisches Array
Ein Array von Segment-IDs, die zuvor realisierte Segmente und neue Segmente enthalten, für die der Besucher qualifiziert ist.
All Traits
Numerisches Array
Ein Array von Eigenschaften-IDs von Erstanbietern und Drittanbietern, die zuvor realisierte Eigenschaften und neue Eigenschaften enthalten, für die sich der Besucher seit dem letzten generierten Datenfeed qualifiziert hat.

Customer Data Feed Dateistruktur

Listen und definiert die Datenstruktur einer CDF Datei. Dazu gehören Datensequenzen, Feldtrennzeichen und Trennzeichen, eine Datendateizuordnung und eine Musterdatei.

Datenfeld-IDs und -Sequenzen

CDF -Dateien keine gekennzeichneten Spalten oder Feldkopfzeilen enthalten. Stattdessen definiert eine CDF Datei Felder und Arrays mit nicht druckbaren ASCII Zeichen. Außerdem werden in der CDF Datei alle Felder und Arrays in einer bestimmten Reihenfolge Liste. Anhand der Feldkennungen und der Reihenfolge können Sie die Datei richtig analysieren.
CDF-Dateielement Beschreibung
Feldtrennzeichen und Trennzeichen
Diese nicht druckbaren Zeichen definieren die Elemente und die Struktur Ihrer CDF-Datei:
  • Strg+a (ASCII 001 oder ^A ) trennt Daten in einzelnen Feldern mit einem Indikator für nicht druckbare Leerzeichen.
  • Strg+b (ASCII 002 oder ^B ) trennt Daten von einem Array und Anforderungsparameter.
  • Strg+C (ASCII 003 oder ^C ) definiert Schlüssel-Wert-Paare.
Feldsequenz
Wichtig: Audience Manager behält sich das Recht vor, neue Felder am Ende der CDF-Datei in zukünftigen Versionen hinzuzufügen. Das bedeutet, dass das technische Design Ihres Dateianalysesystems keine feste Anzahl von Spalten annehmen sollte (obwohl es eine feste Reihenfolge für vorhandene Spalten annehmen kann).
Daten in Ihrer CDF-Datei werden in der unten stehenden Reihenfolge angezeigt.
  1. Ereignis
  2. Gerät
  3. Behälter-ID
  4. Realisierte Eigenschaften
  5. Realisierte Segmente
  6. Anfrageparameter
  7. Referer
  8. IP-Adresse
  9. Experience Cloud Device ID (oder MID). See also, Cookies and the Adobe Experience Platform Identity Service
  10. Alle Segmente
  11. Alle Eigenschaften
Feldbeschreibungen finden Sie unter Inhalt des Kundendatenfeeds definiert .

CDF Dateizuordnung

CDF Dateidaten werden in der unten stehenden Reihenfolge angezeigt.

Identifizieren von Arrays

Arrays in einem CDF Beginn und enden mit dem Ctrl + a Feldtrenner. Dadurch wird das erste Element in einem Array wie ein eigenständiges Datenfeld angezeigt. Beispielsweise die Beginn des realisierten traits Arrays mit ^A1234 . Das Array-Trennzeichen und die ID ^B5678 folgen diesem Eintrag. Daher könnten Sie versucht sein zu glauben, dass das erste Element im erkannten traits Array die ID 5678 ist (weil es mit ^B ). Dies ist nicht der Fall, weshalb Sie mit der Reihenfolge und Struktur einer Datendatei vertraut sein müssen. Auch wenn das erste Element im erkannten trait Array (oder eines der anderen Arrays in einer CDF Datei) Beginn mit ^A ist, definiert die Reihenfolge des Erscheinungsbilds oder der Position in der Datei den Beginn eines Arrays. Und das erste Element in einem Array wird immer vom vorherigen Eintrag durch ^A getrennt.

Sample CDF File

Eine Beispieldatei CDF könnte wie folgt aussehen. Wir haben Zeilenumbrüche in dieses Beispiel eingefügt, um es an die Seite anzupassen.

Customer Data Feed Dateibenennungskonventionen

In den folgenden Abschnitten werden die Elemente im CDF Dateinamen definiert.

CDF Dateiname: Syntax und Beispiel

Ein typischer CDF Dateiname enthält die unten aufgeführten Elemente. Note, italics indicates a variable placeholder:

Syntax

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

Beispiel

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

In Ihrer S3 Datenspeicherung werden die Dateien in aufsteigender Reihenfolge nach Partner-ID (PID), Tag und Stunde sortiert.

CDF Definierte Dateinamenelemente

In der folgenden Tabelle werden die Elemente in einem CDF Dateinamen Liste und definiert.
Dateinamenelement Beschreibung
s3://aam-cdf/
Dies ist der standardmäßige Stammordner für die Datenspeicherung Ihrer CDF-Datei auf einem Amazon S3-Server.
your S3 bucket name
Der Name des schreibgeschützten S3-Behälters, der Ihre CDF-Dateien enthält.
day= yyyy-mm-dd
Das Datum, an dem Ihre Datei verarbeitet wurde.
hour= hh
Ein Zeitwert, der in 24-Stunden-Notation ausgedrückt und in der UTC-Zeitzone eingestellt wird. Siehe auch Zeiten für Kundendaten-Feed-Dateien und Zeiten für Dateiinhalte... .
partner ID
Ihre Partner-ID.
AAM process ID _0
Eine interne Audience Manager -Prozess-ID.
.gz
Eine gzip-Dateierweiterung. CDF-Dateien werden gzip-komprimiert.

Customer Data Feed Benachrichtigungen zur Dateiverarbeitung

Audience Manager schreibt eine .info Datei in Ihr S3 Verzeichnis, um Sie darüber zu informieren, wann Customer Data File (CDF) zum Download bereit ist. Die .info Datei enthält auch JSON formatierte Metadaten zum Inhalt Ihrer CDF Dateien. In diesem Abschnitt finden Sie Informationen zur Syntax und den Feldern, die von dieser Benachrichtigungsdatei verwendet werden.

Beispielinformationsdatei

Jede .info Datei enthält einen Files und einen Totals -Abschnitt. Der Files Abschnitt enthält ein Array, das für jede stündliche Datei spezifische Metriken enthält. Der Totals Abschnitt enthält Metriken, die an einem bestimmten Tag in all Ihren CDF Dateien aggregiert werden. Der Inhalt Ihrer .info Datei könnte dem folgenden Beispiel ähneln.
{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Felder für Infodateien definiert

Die folgenden Tabellen werden Liste und definieren die Elemente in einer CDF .info Datei.

Dateiobjekt

Feld Beschreibung
Files
Beginns des Arrays, das Metadaten zu Ihren CDF-Dateien enthält.
FileByteSize
Dateigröße in Byte.
FileChecksumMD5
Das Amazon S3 ETag. Die Zahl nach dem Bindestrich zeigt die Anzahl der Teile, die zum Erstellen der Datei während des mehrteiligen Uploads verwendet wurden. Der Wert ETag ist nicht identisch mit der MD5-Prüfsumme der Datei.
FileName
FileSequenceNumber
Eine Indexnummer für jede Datei.

Gesamtobjekt

Feld Beschreibung
Totals
Beginns des Objekts, das aggregierte Daten zu allen CDF-Dateien enthält.
Day
Der Tag, an dem die Daten verfügbar sind. Verwendet das Format yyyy-mm-dd .
Hour
Die Stunde, für die Daten verfügbar sind. Verwendet das 24-Stunden-Format, das in der UTC-Zeitzone festgelegt ist.
TotalByteSize
Gesamtgröße aller CDF-Dateien für dieses Datum in Byte.
TotalNumberFiles
Gesamtanzahl der Dateien, die in Ihren S3-Ordner hochgeladen wurden.

Customer Data Feed Die Zeiten für Dateinamen und Dateiinhalt sind unterschiedlich

Ihre CDF Datei enthält Zeitstempel im Dateinamen und im Dateiinhalt. Diese Zeitstempel zeichnen verschiedene Ereignis-Prozesse für dieselbe CDF Datei auf. Es ist nicht ungewöhnlich, dass unterschiedliche Zeitstempel im Namen und Inhalt derselben Datei angezeigt werden. Die Kenntnis jedes Zeitstempels kann Ihnen dabei helfen, gängige Fehler beim Arbeiten mit diesen Daten oder beim Versuch, sie nach Zeit zu sortieren, zu vermeiden.

Suchen von CDF Dateizeitstempeln

CDF -Dateien die Zeit in zwei verschiedenen Speicherorten unterschiedlich aufzeichnen.

Die Unterschiede zwischen Zeitstempeln verstehen

Die folgende Tabelle enthält weitere Details zu Ihren CDF Datei-Zeitstempeln sowie Informationen zur ordnungsgemäßen Verwendung.
Zeitstempelposition
Beschreibung
Dateiname
Der Zeitstempel im CDF Dateinamen kennzeichnet den Zeitpunkt, zu dem die Datei für den Versand vorbereitet Audience Manager wurde. Dieser Zeitstempel wird in der UTC Zeitzone festgelegt. Es verwendet den hour= Parameter, wobei die Uhrzeit als 2-stellige Stunde in 24-Stunden-Notation formatiert wird. Dieser Zeitpunkt kann sich von der im Dateiinhalt aufgezeichneten Ereignis-Zeit unterscheiden. Beim Arbeiten mit CDF Dateien werden Sie manchmal bemerken, dass der S3 Behälter für eine bestimmte Stunde leer ist. Ein leerer Behälter bedeutet:
  • Es gibt keine Daten für diese bestimmte Stunde.
  • Unsere Server sind unter hoher Belastung und können keine Dateien für eine bestimmte Stunde verarbeiten. Wenn der Server erfasst, werden die Dateien, die in früheren Zeitbehälterdateien enthalten sein sollten, in einen Behälter mit einem späteren Zeitwert gelegt. Dies wird beispielsweise angezeigt, wenn eine Datei, die im 17-Stunden-Bucket enthalten sein sollte, im 18-Stunden-Bucket (mit hour=18 dem Dateinamen) angezeigt wird. In diesem Fall hat der Server wahrscheinlich die Verarbeitung der Datei in Stunde 17 begonnen, konnte sie jedoch nicht innerhalb dieses Zeitintervalls abschließen. Stattdessen wird die Datei in den nächsten Stundenzähler verschoben.
Wichtig : Verwenden Sie nicht den Zeitstempel für Dateinamen, um Ereignis nach Zeit zu gruppieren. Wenn Sie nach Zeit gruppieren müssen, verwenden Sie den EventTime Zeitstempel im Dateiinhalt.
Dateiinhalt
Der Zeitstempel im CDF Dateiinhalt kennzeichnet den Zeitpunkt, zu dem die Verarbeitung der Datei Data Collection Servers begonnen hat. Dieser Zeitstempel wird in der UTC Zeitzone festgelegt. Es verwendet das EventTime Feld, wobei die Uhrzeit als yyyy-mm-dd hh:mm:ss . Diese Uhrzeit entspricht der tatsächlichen Uhrzeit des Ereignisses auf der Seite, kann jedoch von der Stundenanzeige im Dateinamen abweichen.
Tipp : Im Gegensatz zum hour= Zeitstempel im Dateinamen können Sie Daten nach Zeit gruppieren EventTime lassen.