Catalog Service – Übersicht

Catalog Service ist ein Aufzeichnungssystem für Speicherort und Herkunft von Daten in Adobe Experience Platform. Alle Daten, die in Experience Platform aufgenommen werden, werden als Dateien und Ordner im Data Lake gespeichert. Catalog wiederum speichert die Metadaten und Beschreibungen dieser Dateien und Ordner für Such- und Überwachungszwecke.

Einfach ausgedrückt, dient Catalog als Metadatenspeicher oder „Katalog“, in dem Informationen zu allen in Experience Platform gespeicherten Daten abrufbar sind. Mithilfe von Catalog erhalten Sie Antworten auf folgende Fragen:

  • Wo befinden sich meine Daten?
  • Auf welcher Stufe der Verarbeitung befinden sich diese Daten?
  • Welche Systeme oder Prozesse haben Aktionen auf meine Daten ausgeführt?
  • Wie viele Daten wurden erfolgreich verarbeitet?
  • Welche Fehler sind bei der Verarbeitung aufgetreten?

Im Rahmen von Catalog steht eine RESTful-API zur Verfügung, mit deren Hilfe Sie Platform-Metadaten anhand von grundlegenden CRUD-Operationen programmgesteuert verwalten können. Weitere Informationen finden Sie im Katalog-Service-Entwicklerhandbuch.

Catalog- und Experience Platform-Services

Die Ressourcen, die von Catalog Service verfolgt werden, werden von mehreren Experience Platform-Services verwendet. Um die Möglichkeiten von Catalog’s optimal zu nutzen, sollten Sie sich mit diesen Services vertraut machen und auch damit, wie sie mit Catalog interagieren.

Experience Data Model (XDM)-System

Das Experience Data Model (XDM)-System ist das standardisierte Framework, mit dem Platform Kundenerlebnisdaten organisiert. Experience PlatformXDM-Schemas dienen in zur konsistenten und wiederverwendbaren Beschreibung der Struktur von Daten.

Bei der Aufnahme von Daten in Platform wird die Struktur dieser Daten einem XDM-Schema zugeordnet und in Data Lake als Teil eines Datensatzes gespeichert. Die Metadaten der einzelnen Datensätze werden von Catalog Service dokumentiert, wobei ein Verweis auf das dem Datensatz entsprechende XDM-Schema enthalten ist.

Informationen zum XDM-System im Allgemeinen finden Sie in der Übersicht über das XDM-System.

Data Ingestion

Experience Platform nimmt Daten aus verschiedenen Quellen auf und legt diese Aufzeichnungen als Datensätze in Data Lake ab. Die Metadaten für diese Datensätze werden allesamt in Catalog dokumentiert, unabhängig von ihrer Quelle oder der Methode ihrer Aufnahme.

Bei Verwendung der Batch-Erfassungsmethode werden in Catalog außerdem zusätzliche Metadaten für Batch-Dateien festgehalten. Batches sind Dateneinheiten aus einer oder mehreren Dateien, die als Ganzes aufgenommen werden. Catalog dokumentiert die Metadaten für diese Batch-Dateien sowie die Datensätze, in denen sie nach der Aufnahme festgehalten werden. Batch-Metadaten umfassen Informationen zur Anzahl der erfolgreich aufgenommenen Datensätze sowie zu fehlgeschlagenen Datensätzen und zugehörige Fehlermeldungen.

Weitere Informationen finden Sie in der Datenerfassung – Übersicht.

Catalog-Objekte

Wie im vorherigen Abschnitt erläutert, werden in Catalog Metadaten für verschiedene Arten von Ressourcen und Vorgänge dokumentiert, die von anderen Platform-Services genutzt werden. Catalog Der Katalog unterhält einen eigenen „Objektspeicher“, in dem diese Metadaten eingekapselt werden. Catalog-Objekte sind abfragbare Darstellungen von Platform-Daten, über die Sie Ihre Daten suchen, überwachen und beschriften können, ohne auf die Daten an sich zugreifen zu müssen.

In der folgenden Tabelle sind die verschiedenen von Catalog unterstützten Objekttypen aufgeführt:

Objekt
API-Endpunkt
Definition
Batch
/batches
Batches sind Dateneinheiten aus einer oder mehreren Dateien, die als Ganzes aufgenommen werden. Ein Batch-Objekt in Catalog erfasst Metriken zur Batch-Aufnahme (beispielsweise die Anzahl der verarbeiteten Datensätze oder ihre Größe auf der Festplatte) und kann außerdem Links zu Datensätzen, Ansichten und andere Ressourcen enthalten, die von der Batch-Operation betroffen waren.
Datensatz
/dataSets
Ein Datensatz ist ein Konstrukt zur Datenspeicherung und -verwaltung, in dem Daten (in der Regel) in einer Tabelle erfasst werden, die ein Schema (Spalten) und Felder (Zeilen) beinhaltet. Weiterführende Informationen dazu finden Sie in der Übersicht zu Datensätzen.
Datensatzdatei
/datasetFiles
Datensatzdateien repräsentieren Datenblöcke, die auf Platform gespeichert wurden. Sie stellen Aufzeichnungen von Literaldateien und liefern als solches Informationen zur Dateigröße, zur Anzahl der darin enthaltenen Datensätze und einen Verweis auf den Batch, in dem die Datei aufgenommen wurde.

Nächste Schritte

Dieses Dokument diente als Einführung in Catalog Service und seine Funktionsweise in Experience Platform. Die einzelnen Schritte für die Interaktion mit den verschiedenen Endpunkten der zugehörigen Catalog-API finden Sie im Catalog Entwicklerhandbuch. Es wird empfohlen, auch das Handbuch zum Thema Filtern von Katalogdaten durchzugehen, da darin Best Practices für die Beschränkung der in API-Antworten zurückgegebenen Daten erläutert werden.

recommendation-more-help
c5c02be6-79a3-4a2f-b766-136bffe8b676