Daten-Feed-Inhalte - Übersicht

In den folgenden Abschnitten wird beschrieben, wie Sie auf die Dateien in einer Daten-Feed-Bereitstellung zugreifen und diese verstehen.

Zugriff auf Daten-Feed-Inhalte

So greifen Sie auf den Inhalt eines Daten-Feeds zu:

  1. Melden Sie sich bei der Daten-Feed-Ziel-Site an.

    Dies ist die Ziel-Site, die Sie beim Erstellen des Daten-Feeds eingerichtet haben, z. B. ein Amazon S3- oder Google Cloud Platform-Bucket.

  2. Laden Sie die komprimierte Daten-Feed-Datei auf Ihren lokalen Computer herunter.

  3. Dekomprimieren Sie die komprimierte Datei mit einem Programm, das .tar.gz-Dateierweiterungen unterstützt.

  4. Öffnen Sie die hit_data.tsv-Datei in Ihrer gewünschten Tabellenkalkulations- oder Datenbankanwendung, um die Rohdaten für diesen Tag anzuzeigen. —>

Manifestdatei feed-manifest

Die Manifestdatei enthält folgende Details zu den einzelnen Dateien, die Bestandteil des hochgeladenen Datensatzes sind:

  • Dateiname
  • Dateigröße
  • MD5-Hash
  • Anzahl der in der Datei enthaltenen Datensätze

Die Manifestdatei hat dasselbe Format wie eine Java-JAR-Manifestdatei.

Die Manifestdatei wird immer abschließend in Form einer separaten .txt-Datei gesendet. Mit der Manifestdatei wird signalisiert, dass der vollständige Datensatz für den Anforderungszeitraum ausgeliefert wurde. Manifestdateien werden nach folgendem Muster benannt:

[rsid]_[YYYY-mm-dd].txt

Eine typische Manifestdatei enthält Daten, die folgendem Schema entsprechen:

Datafeed-Manifest-Version: 1.0
 Lookup-Files: 1
 Data-Files: 1
 Total-Records: 611

 Lookup-File: rsid_date-lookup_data.tar.gz
 MD5-Digest: af6de42d8b945d4ec1cf28360085308
 File-Size: 63750

 Data-File: 01-rsid_date.tsv.gz
 MD5-Digest: 9c70bf783cb3d0095a4836904b72c991
 File-Size: 122534
 Record-Count: 611

Jede Manifestdatei enthält eine Kopfzeile, in der die Gesamtanzahl der Lookup-Dateien, Datendateien sowie die Gesamtanzahl der Datensätze in allen Datendateien angegeben sind. Nach dieser Kopfzeile folgen verschiedene Abschnitte mit Informationen zu den einzelnen Dateien, die in der Datenfeedauslieferung enthalten sind.

Einige Feeds sind so konfiguriert, dass sie eine .fin-Datei anstelle einer .txt-Manifestdatei erhalten. Dabei gibt die .fin-Datei an, dass der Upload abgeschlossen ist. Die Datei enthält jedoch keine Metadaten zum Upload.

Lookup-Dateien

In manchen Daten-Feed-Spalten wird eine Zahl ausgegeben, die einem Wert entspricht. Lookup-Dateien werden verwendet, um diese Zahl in einer Daten-Feed-Spalte einem tatsächlichen Wert zuzuordnen. Beispielsweise bedeutet der Wert „497“ in der Spalte mit den browser-Trefferdaten, dass der Treffer von „Microsoft Internet Explorer 8“ stammte, wie in browser.tsv ersichtlich ist.

Beachten Sie, dass column_headers.tsv und event_list.tsv spezifisch für den Daten-Feed und die Report Suite sind. Andere Dateien, z. B. browser.tsv, sind hingegen generisch.

Lookup-Dateien werden in einer komprimierten ZIP-Datei bereitgestellt, die nach folgendem Muster benannt ist:

[rsid]_[YYYY-mm-dd]-lookup_data.[compression_suffix]
  • column_headers.tsv: Eine einzelne Zeile mit den Spaltenüberschriften für hit_data.tsv.
  • browser.tsv: Ordnet die Browser-ID (die browser Feed-Spalte) zum Anzeigenamen des Browsers hinzu.
  • browser_type.tsv: Ordnet die Browser-ID (die browser Feed-Spalte) zum Browsertyp hinzu.
  • color_depth.tsv: Ordnet die Farbtiefen-ID (die color Feed-Spalte) in die Farbtiefe.
  • connection_type.tsv: Ordnet die Verbindungstyp-ID (die connection_type Feed-Spalte) zum Verbindungstyp hinzu.
  • country.tsv: Ordnet die Länder-ID zu (die country Feed-Spalte) zum Ländernamen hinzu.
  • javascript_version.tsv: Ordnet die JavaScript-Versions-ID (die javascript -Feed-Spalte) zur JavaScript-Version hinzugefügt.
  • languages.tsv: Ordnet die Sprach-ID (die language Feed-Spalte) in die Sprache hinzu.
  • operating_systems.tsv: Ordnet die Betriebssystem-ID zu (die os Feed-Spalte) auf den Namen des Betriebssystems hinzu.
  • plugins.tsv: Ordnet die Plug-in-IDs (die plugin Feed-Spalte) zu den jeweiligen Plug-in-Namen hinzu.
  • resolution.tsv: Ordnet die Auflösungs-ID (die resolution Feedspalte) zur Bildschirmauflösung hinzu.
  • referrer_type.tsv: Ordnet die Referrer-Typ-ID zu (die ref_type Feed-Spalte) zum Typ der verweisenden Stelle.
  • search_engines.tsv: Ordnet die Suchmaschinen-ID (die search_engine Feed-Spalte) zum Suchmaschinennamen hinzu.
  • event.tsv: Ordnet jede Ereignis-ID zu (die event_list Feed-Spalte) auf den entsprechenden Ereignisnamen hinzu.

Trefferdatendateien

Die Trefferdaten werden in der Datei hit_data.tsv bereitgestellt. Die Menge an Daten in dieser Datei richtet sich nach dem Auslieferungsformat (stündlich oder täglich sowie danach, ob die Auslieferung in einer oder in mehreren Dateien erfolgt). Diese Datei enthält nur die Trefferdaten. Die Spaltenkopfzeilen werden separat mit den Lookup-Dateien geliefert. Jede Zeile in dieser Datei entspricht einem einzelnen Server-Aufruf.

Die von Adobe bereitgestellten Dateien variieren je nach Art des konfigurierten Daten-Feeds. Alle Dateien sind ISO-8859-1-kodiert.

  • [rsid] Bezeichnet die Report Suite-ID, aus der der Daten-Feed stammt.
  • [index] wird nur bei mehreren Datei-Feeds verwendet und bezieht sich auf die richtige Reihenfolge paginierter Dateien.
  • [YYYY-mm-dd] bezeichnet den Starttag des Daten-Feed.
  • [HHMMSS] wird nur in stündlichen Feeds verwendet und bezeichnet den Startzeitpunkt des Daten-Feed.
  • [compression_suffix] bezeichnet die Art der verwendeten Komprimierung. Normalerweise werden Daten-Feeds in tar.gz- oder zip-Dateien komprimiert.

Täglich; einzelne Datei

Nachdem die Daten einen Tag lang erfasst wurden, erhalten Sie eine einzelne komprimierte Datendatei und eine Manifestdatei. Die Datendatei hat den Namen:

[rsid]_[YYYY-mm-dd].[compression_suffix]

Nach dem Extrahieren enthält die Datendatei eine einzelne hit_data.tsv-Datei, die alle Daten für diesen Tag beinhaltet, sowie Lookup-Dateien für alle erforderlichen Spalten.

Täglich; mehrere Dateien

Nachdem die Daten einen Tag lang erfasst wurden, erhalten Sie eine oder mehrere komprimierte Datendateien und eine Manifestdatei. Die Datendatei hat den Namen:

[index]-[rsid]_[YYYY-mm-dd].[compression_suffix]

Nach dem Extrahieren enthält jede Datendatei eine einzelne hit_data.tsv-Datei, die ca. 2 GB unkomprimierte Daten beinhaltet, sowie Lookup-Dateien für alle erforderlichen Spalten.

Stündlich; einzelne Datei

Nachdem die Daten eine Stunde lang erfasst wurden, erhalten Sie eine einzelne komprimierte Datendatei und eine Manifestdatei. Die Datendatei hat den Namen:

[rsid]_[YYYYmmdd]-[HHMMSS].[compression_suffix]

Nach dem Extrahieren enthält die Datendatei eine einzelne hit_data.tsv-Datei, die alle Daten für diese Stunde beinhaltet, sowie Lookup-Dateien für alle erforderlichen Spalten.

Stündlich; mehrere Dateien

Nachdem die Daten eine Stunde lang erfasst wurden, erhalten Sie eine oder mehrere komprimierte Datendateien und eine Manifestdatei. Die Datendatei hat den Namen:

[index]-[rsid]_[YYYYmmdd]-[HHMMSS].[compression_suffix]

Nach dem Extrahieren enthält jede Datendatei eine einzelne hit_data.tsv-Datei, die ca. 2 GB unkomprimierte Daten beinhaltet, sowie Lookup-Dateien für alle erforderlichen Spalten.

Größe der Datendatei

Die Größe der Trefferdatei kann in Abhängigkeit von der Anzahl der aktiv genutzten Variablen und dem Traffic an die Report Suite stark variieren. Eine Datenzeile ist durchschnittlich 500 B (komprimiert) oder 2 KB (unkomprimiert) groß. Dieser Wert multipliziert mit der Anzahl der Server-Aufrufe ergibt einen ungefähren Schätzwert zur Größe einer Daten-Feed-Datei. Sobald Ihr Unternehmen Daten-Feed-Dateien empfängt, können Sie eine genauere Zahl feststellen, indem Sie die Anzahl der Zeilen in hit_data.tsv durch die Gesamtdateigröße dividieren.

recommendation-more-help
6b7d49d5-f5fe-4b7f-91ae-5b0745755ed2