Customer Data Feeds customer-data-feeds

Grundlegende Informationen Customer Data Feed (CDF) Dateien und Anweisungen zu den ersten Schritten. Beginnen Sie hier, wenn Sie Interesse haben CDF oder Sie benötigen einfach weitere Informationen.

Dateiinhalt und Zweck file-contents-purpose

Eine CDF-Datei enthält dieselben Daten, die ein Audience Manager-Ereignisaufruf (/event) an unsere Server sendet. Dazu gehören Daten wie Benutzer-IDs, trait IDs, segment IDsund alle anderen Parameter, die von einem Ereignisaufruf erfasst werden. intern Audience Manager Systeme verarbeitet Ereignisdaten in einer CDF -Datei mit Inhalten, die in Feldern angeordnet sind, die in einer bestimmten Reihenfolge angezeigt werden. Audience Manager Versuche, CDF Dateien stündlich speichern und in einem sicheren, kundenspezifischen Behälter auf einem Amazon S3 Server. Wir stellen diese Dateien bereit, damit Sie mit Audience Manager Daten außerhalb der durch unsere Benutzeroberfläche festgelegten Grenzen.

IMPORTANT
Beachten Sie beim Arbeiten mit CDF-Dateien die folgenden Einschränkungen:
  • Stellen Sie vor der Einrichtung der CDF-Dateibereitstellung sicher, dass Sie über die entsprechenden Berechtigungen von Drittanbietern für den Export von Eigenschaften von Drittanbietern verfügen. Audience Manager unterstützt derzeit keine Funktionalität in der Benutzeroberfläche, um die Exportberechtigung für CDF-Dateien von Datenanbietern von Drittanbietern anzufordern. Wenden Sie sich daher an diese unabhängig.
  • Sie sollten CDF -Dateien als Proxy zur Überwachung des Seitenverkehrs, zur Abstimmung von Berichtsdiskrepanzen oder zur Rechnungsstellung usw.

Erste Schritte getting-started

Es gibt keinen zu startenden Self-Service-Prozess CDF Dateibereitstellung. Wenden Sie sich an Audience Manager -Berater oder Kundenunterstützung . Während der Implementierung Audience Manager wird

  • Richten Sie Ihre Amazon S3 Speicherbehälter.
  • Schreibgeschützt bereitstellen S3 Authentifizierungsberechtigungen für Ihren Dateispeicherbehälter. Sie können Verzeichnisse und Dateien, die zu anderen Kunden gehören, nicht sehen oder darauf zugreifen.

Dateibenachrichtigungen und CDF -Dateien werden in S3 Bucket, wenn sie zum Download bereit sind. Sie sind für die Überwachung und das Herunterladen von Dateien von Ihrem zugewiesenen S3 Verzeichnis. Siehe Verarbeitungsbenachrichtigungen für CDF-Dateien.

Nächste Schritte next-steps

Die folgenden Abschnitte und die Häufig gestellte Fragen zu Kundendaten-Feeds kann Ihnen dabei helfen, sich mit diesem Dienst besser vertraut zu machen.

Customer Data Feed Definierte Inhalte cdf-defined

Listet die Datenelemente und Arrays auf und definiert sie in einer CDF -Datei in der Reihenfolge ihres Erscheinungsbilds. Definitionen umfassen Datentypen, diese Informationen sind jedoch nicht Teil eines CDF -Datei.

IMPORTANT
Ereignispixel sind in CDF-Konfigurationen standardmäßig ausgeschlossen. Stellen Sie sicher, dass Sie in Ihrer Anfrage an die Kundenunterstützung angeben, wenn Sie möchten, dass in Ihren CDF-Dateien Ereignispixel enthalten sind. Jedes Ereignis-Pixel wird in Ihren CDF-Dateien als eindeutige Zeile gefüllt.

Definitionen definitions

A CDF enthält einige oder alle unten definierten Felder. Informationen zur internen Dateiorganisation finden Sie unter Dateistruktur des Kundendaten-Feeds.

Feld
Datentyp
Beschreibung
Event Time
Zeitstempel

Der Zeitpunkt, zu dem eine CDF-Datei von der Datenerfassungsserver (DCS). Der Zeitstempel verwendet die yyyy-mm-dd hhss und wird in der UTC-Zeitzone festgelegt.

Hinweis: Die Ereigniszeit ist nicht:

Device
Zeichenfolge
Dies ist die Eindeutige Benutzer-ID (UUID), eine 38-stellige Geräte-ID für Ihren Site-Besucher. Weitere Informationen finden Sie unter Index of IDs in Audience Manager.
Container ID
Numerisch
Die ID des Containers, der ID-Synchronisierungen auslöst. Dieses Feld wird nur ausgefüllt, wenn Sie die Container-ID im d_nsid in Ihrer Site-Implementierung. Andernfalls wird der Standardwert von 0 nicht in CDF-Dateien enthalten sein.
Realized Traits
Numerisches Array

Ein Array von Eigenschaften-IDs, die alle Eigenschaften enthalten, die ein Besucher im Ereignisaufruf realisiert (für die er qualifiziert ist) hat.

Beachten Sie, dass das -Array Eigenschaften enthalten kann, für die sich der Besucher zuvor qualifiziert hatte und für die er sich durch diesen Ereignisaufruf erneut qualifiziert hat.

Realized Segments
Numerisches Array
Ein Array von Segment-IDs, die alle Segmente enthalten, die ein Besucher im Ereignisaufruf realisiert (für die er qualifiziert ist) hat.
Request Parameters
Zeichenfolge

Eine Zeichenfolge, die alle Parameter erfasst (Variablen, IDs, Schlüssel-Wert-Paare, Geräte-Werbe-IDs usw.) beim Ereignisaufruf übergeben wird.

Kurzes Beispiel:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
Zeichenfolge
Die nicht kodierte URL der verweisenden Seite (falls vorhanden).
IP Data Type
Zeichenfolge
Die IP-Adresse des Besuchers, der im Ereignisaufruf erfasst wurde.
MCDevice
Zeichenfolge
Die Experience Cloud Dem Site-Besucher zugewiesene ID (MID). Siehe auch Cookies und der Adobe Experience Platform Identity-Dienst.
All Segments
Numerisches Array
Ein Array von Segment-IDs, die zuvor realisierte Segmente und neue Segmente enthalten, für die der Besucher qualifiziert ist.
All Traits
Numerisches Array
Ein Array von Erstanbieter- und Drittanbieter-Eigenschafts-IDs, die zuvor realisierte Eigenschaften und neue Eigenschaften enthalten, für die sich der Besucher seit dem letzten generierten Daten-Feed qualifiziert hat.

Customer Data Feed Dateistruktur cdf-file-structure

Listet die Datenstruktur einer CDF -Datei. Dazu gehören Datensequenz, Feldtrennzeichen und Trennzeichen, eine Datendateizuordnung und eine Beispieldatei.

Datenfeld-IDs und -Sequenzen identifiers-and-sequence

CDF -Dateien enthalten keine gekennzeichneten Spalten oder Feldkopfzeilen. Stattdessen wird eine CDF -Datei definiert Felder und Arrays ohne Drucken ASCII Zeichen. Außerdem wird die CDF -Datei listet jedes Feld und Array in einer bestimmten Reihenfolge auf. Mithilfe der Kennungen und der Reihenfolge der Felder können Sie die Datei richtig analysieren.

CDF-Dateielement
Beschreibung
Feldtrennzeichen und -trennzeichen

Diese nicht druckbaren Zeichen definieren die Elemente und die Struktur Ihrer CDF-Datei:

  • Strg + A (ASCII) 001 oder ^A) trennt die Daten in einzelnen Feldern mit einer nicht druckbaren Leerzeichen.
  • Strg + B (ASCII) 002 oder ^B) trennt Daten, ein Array und Anforderungsparameter.
  • Strg + C (ASCII) 003 oder ^C) definiert Schlüssel-Wert-Paare.
Feldsequenz

Wichtig: Audience Manager behält sich das Recht vor, neue Felder am Ende der CDF-Datei in zukünftigen Versionen hinzuzufügen. Das bedeutet, dass das technische Design Ihres Dateianalysesystems keine feste Anzahl von Spalten annehmen sollte (obwohl es eine feste Reihenfolge für vorhandene Spalten annehmen kann).

Daten in Ihrer CDF-Datei werden in der unten gezeigten Reihenfolge angezeigt. /N kann anstelle eines dieser Felder angezeigt werden, was einen Nullwert angibt.

  1. Ereigniszeit
  2. Gerät
  3. Behälter-ID
  4. Realisierte Eigenschaften
  5. Realisierte Segmente
  6. Anfrageparameter
  7. Referer
  8. IP-Adresse
  9. Experience Cloud Device ID (oder MID). Siehe auch Cookies und der Adobe Experience Platform Identity-Dienst
  10. Alle Segmente
  11. Alle Eigenschaften

Feldbeschreibungen finden Sie unter Definierte Kundendaten-Feed-Inhalte.

CDF Dateizuordnung cdf-file-map

CDF -Dateidaten werden in der unten gezeigten Reihenfolge angezeigt.

Identifizieren von Arrays

Arrays in einer CDF -Datei beginnen und enden mit der Ctrl + a Feldtrennzeichen. Dadurch wird das erste Element in einem Array wie ein eigenständiges Datenfeld angezeigt. Beispielsweise wird die traits Array beginnt mit ^A1234. Array-Trennzeichen und -ID ^B5678 folgt diesem Eintrag. Daher könnten Sie versucht sein, zu glauben, dass das erste Element in der traits Array ist ID 5678 (da es mit ^B). Dies ist nicht der Fall. Daher müssen Sie mit der Sequenz und Struktur einer Datendatei vertraut sein. Auch wenn das erste Element im realisiert wurde trait Array (oder eines der anderen Arrays in einer CDF -Datei) beginnt mit ^A, definiert die Reihenfolge des Erscheinungsbilds oder der Position in der Datei den Beginn eines Arrays. Und das erste Element in einem Array wird immer vom vorherigen Eintrag durch ^A.

Beispiel CDF Datei sample-file

Beispiel CDF -Datei in etwa wie folgt aussehen. Wir haben Zeilenumbrüche in dieses Beispiel eingefügt, damit es an die Seite angepasst werden kann.

Customer Data Feed Namenskonventionen für Dateien cdf-naming-conventions

In den folgenden Abschnitten werden die Elemente in der CDF Dateiname.

CDF Dateiname: Syntax und Beispiel cdf-file-name

Eine typische CDF Der Dateiname enthält die unten aufgeführten Elemente. Hinweis: kursiv gibt einen Variablenplatzhalter an:

Syntax

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Beispiel

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

In S3 -Speicher, werden die Dateien in aufsteigender Reihenfolge nach Partner-ID (PID), Tag und Stunde.

CDF Definierte Dateinamenelemente cdf-file-name-elements

In der folgenden Tabelle sind die Elemente in einer CDF Dateiname.

Dateinamenelement
Beschreibung
s3://aam-cdf/
Dies ist der standardmäßige Stammspeicherbehälter für Ihre CDF-Datei auf einem Amazon S3-Server.
your S3 bucket name
Der Name des schreibgeschützten S3-Buckets, der Ihre CDF-Dateien enthält.
day=yyyy-mm-dd
Das Datum, an dem Ihre Datei verarbeitet wurde.
hour=hh
Ein Zeitwert, der in 24-Stunden-Notation ausgedrückt und in der UTC-Zeitzone festgelegt wird. Siehe auch Zeitpunkte der Kundendaten-Feed-Datei und Zeiten des Dateiinhalts ....
partner ID
Ihre Partner-ID.
File Sequence_0
Werte, die die Dateisequenz angeben. Die Sequenz erhöht sich wie folgt: 0_0_0 , 0_1_0, 0_2_0 ....1_0_0
.gz
Eine gzip-Dateierweiterung. CDF-Dateien sind gzip-komprimiert.

Customer Data Feed Dateiverarbeitungsbenachrichtigungen cdf-file-processing-notifications

Audience Manager schreibt eine .info Datei S3 -Verzeichnis, über das Sie erfahren können, wann Ihre Customer Data File (CDF) kann heruntergeladen werden. Die .info auch JSON formatierte Metadaten zum Inhalt Ihrer CDF Dateien. In diesem Abschnitt finden Sie Informationen zur Syntax und zu den Feldern, die von dieser Benachrichtigungsdatei verwendet werden.

Beispiel-Info-Datei sample-info-file

Jeder .info -Datei enthält Files und Totals Abschnitt. Die Files -Abschnitt enthält ein Array, das spezifische Metriken für jede stündliche Datei enthält. Die Totals enthält Metriken, die über all Ihre CDF -Dateien für einen bestimmten Tag. Der Inhalt Ihrer .info -Datei ähnlich wie im folgenden Beispiel aussehen.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Definierte Informationsdateifelder info-file-fields-defined

In den folgenden Tabellen sind die Elemente aufgelistet und in einer CDF .info -Datei.

Dateiobjekt

Feld
Beschreibung
Files
Startet das Array, das Metadaten zu Ihren CDF-Dateien enthält.
FileByteSize
Dateigröße in Byte.
FileChecksumMD5
Das Amazon S3 ETag. Die Zahl nach dem Bindestrich zeigt die Anzahl der Teile an, die zum Erstellen der Datei während des mehrteiligen Uploads verwendet wurden. Die ETag ist nicht mit der MD5-Prüfsumme der Datei identisch.
FileName
Der Dateiname. Siehe Namenskonventionen für CDF-Dateien.
FileSequenceNumber
Eine Indexnummer für jede Datei.

Gesamtobjekt

Feld
Beschreibung
Totals
Startet das Objekt, das aggregierte Daten zu allen CDF-Dateien enthält.
Day
Der Tag, für den die Daten verfügbar sind. Verwendet yyyy-mm-dd Format.
Hour
Die Stunde, für die Daten verfügbar sind. Verwendet das in der UTC-Zeitzone eingestellte 24-Stunden-Format.
TotalByteSize
Gesamtgröße aller CDF-Dateien für dieses Datum in Byte.
TotalNumberFiles
Gesamtzahl der in das S3-Verzeichnis hochgeladenen Dateien.

Customer Data Feed Dateinamenzeiten und Dateiinhaltszeiten sind unterschiedlich different-processing-times

Ihre CDF enthält Zeitstempel im Dateinamen und Dateiinhalt. Diese Zeitstempel zeichnen unterschiedliche Ereignisprozesse für dieselben auf CDF -Datei. Es ist nicht ungewöhnlich, verschiedene Zeitstempel im Namen und Inhalt derselben Datei zu sehen. Die Kenntnis jedes Zeitstempels kann Ihnen dabei helfen, häufige Fehler beim Arbeiten mit diesen Daten oder beim Versuch, sie nach Zeit zu sortieren, zu vermeiden.

Standort CDF Datei-Zeitstempel locating-timestamps

CDF -Dateien verzeichnen die Zeit an zwei verschiedenen Speicherorten unterschiedlich.

Unterschiede zwischen Zeitstempeln verstehen understanding-timestamps

Die folgende Tabelle enthält weitere Details zu Ihrer CDF Datei-Zeitstempel sowie Informationen zu ihrer ordnungsgemäßen Verwendung.

Zeitstempelstandort
Beschreibung
Dateiname

Der Zeitstempel in Ihrer CDF Dateiname gibt die Zeit an, zu der Audience Manager hat begonnen, Ihre Datei für den Versand vorzubereiten. Dieser Zeitstempel wird im UTC Zeitzone. Sie verwendet die hour= , wobei die Zeit als 2-stellige Stunde in 24-Stunden-Notation formatiert ist. Diese Zeit kann sich von der im Dateiinhalt aufgezeichneten Ereigniszeit unterscheiden. Beim Arbeiten mit CDF -Dateien, manchmal werden Sie feststellen, dass Ihre S3 für eine bestimmte Stunde leer ist. Ein leerer Behälter bedeutet, dass er eine der folgenden Bedeutungen haben kann:

  • Für diese bestimmte Stunde liegen keine Daten vor.
  • Unsere Server sind stark ausgelastet und können Dateien für eine bestimmte Stunde nicht verarbeiten. Wenn der Server den Upload aufnimmt, werden die Dateien, die in frühere Zeitbehälter-Dateien hätte aufgenommen werden sollen, in einen Bucket mit einem späteren Zeitwert eingefügt. Dies wird beispielsweise angezeigt, wenn eine Datei, die in der Gruppe "Stunde 17"enthalten sein sollte, in der Gruppe "Stunde 18"angezeigt wird (mit hour=18 im Dateinamen). In diesem Fall hat der Server wahrscheinlich mit der Verarbeitung Ihrer Datei in Stunde 17 begonnen, konnte sie jedoch nicht innerhalb dieses Zeitintervalls abschließen. Stattdessen wird die Datei an den nächsten stündlichen Zeitbehälter gesendet.

Wichtig: Verwenden Sie nicht den Zeitstempel des Dateinamens, um Ereignisse nach Zeit zu gruppieren. Wenn Sie eine Gruppe nach Zeit erstellen müssen, verwenden Sie die EventTime Zeitstempel im Dateiinhalt.

Dateiinhalt
Der Zeitstempel in Ihrer CDF Der Dateiinhalt gibt die Zeit an, zu der die Data Collection Servers hat die Verarbeitung der Datei gestartet. Dieser Zeitstempel wird im UTC Zeitzone. Sie verwendet die EventTime -Feld, wobei die Uhrzeit als yyyy-mm-dd hh:mm:ss. Diese Zeit entspricht in etwa der tatsächlichen Zeit des Ereignisses auf der Seite, kann sich jedoch von der Stundenanzeige im Dateinamen unterscheiden.
Tipp: Im Gegensatz zu hour= Zeitstempel im Dateinamen können Sie EventTime um Daten nach Zeit zu gruppieren.
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695