Documentazione Experience Platform Guida al catalogo e ai set di dati

Panoramica di Catalog Service

Last update: Thu Jun 08 2023 00:00:00 GMT+0000 (Coordinated Universal Time)

Argomenti:
Catalog

Creato per:

Developer

Catalog Service è il sistema di registrazione per la posizione e la derivazione dei dati in Adobe Experience Platform. Mentre tutti i dati acquisiti in Experience Platform vengono memorizzati nel Data Lake come file e directory, Catalog contiene i metadati e le descrizioni di tali file e directory a scopo di ricerca e monitoraggio.

In sintesi, Catalog funge da archivio o “catalogo” di metadati in cui è possibile trovare informazioni sui dati all’interno di Experience Platform. È possibile utilizzare Catalog per rispondere alle seguenti domande:

Dove si trovano i miei dati?
In quale fase di elaborazione sono i dati?
Quali sistemi o processi hanno agito in base ai dati?
Quanti dati sono stati elaborati correttamente?
Quali errori si sono verificati durante l’elaborazione?

Catalog fornisce un’API RESTful che consente di gestire in modo programmatico i metadati di Platform mediante operazioni CRUD di base. Per ulteriori informazioni, consulta la guida per sviluppatori di Catalog.

Servizi Catalog e Experience Platform

Le risorse di cui Catalog Service tiene traccia vengono utilizzate da diversi servizi di Experience Platform. Per sfruttare al massimo le capacità di Catalog’s, si consiglia di acquisire familiarità con questi servizi e con il modo in cui interagiscono con Catalog.

Sistema Experience Data Model (XDM)

Il sistema Experience Data Model (XDM) è il framework standardizzato tramite il quale Platform organizza i dati sull’esperienza del cliente. Experience Platform sfrutta gli schemi XDM per descrivere la struttura dei dati in modo coerente e riutilizzabile.

Quando i dati vengono acquisiti in Platform, la struttura di tali dati viene mappata su uno schema XDM e memorizzata all’interno del Data Lake come parte di un set di dati. I metadati per ogni set di dati vengono tracciati da Catalog Service, che include un riferimento allo schema XDM a cui è conforme il set di dati.

Per ulteriori informazioni generali sul sistema XDM, consulta la panoramica del sistema XDM.

Data Ingestion

Experience Platform acquisisce dati da più origini e salva i record in modo permanente come set di dati all’interno di Data Lake. Catalog tiene traccia dei metadati per questi set di dati, indipendentemente dalla loro origine o dal loro metodo di acquisizione.

Quando si utilizza il metodo di acquisizione batch, Catalog tiene traccia anche di metadati aggiuntivi per i file batch. I batch sono unità di dati costituite da uno o più file da acquisire come una singola unità. Catalog tiene traccia dei metadati per i file batch, nonché dei set di dati in cui vengono salvati in modo permanente dopo l’acquisizione. I metadati batch includono informazioni sul numero di record correttamente acquisiti, nonché su eventuali record con errore e sui relativi messaggi di errore.

Per ulteriori informazioni, consulta la panoramica sull’acquisizione dei dati.

Oggetti Catalog

Come descritto nella sezione precedente, Catalog tiene traccia dei metadati per diversi tipi di risorse e operazioni utilizzate da altri servizi Platform. Catalog mantiene il proprio archivio di “oggetti” che incapsulano questi metadati. Gli oggetti Catalog sono rappresentazioni disponibili per query dei dati Platform, che consentono di cercare, monitorare ed etichettare i dati senza necessità di accedere ai dati stessi.

La tabella seguente illustra i diversi tipi di oggetti supportati da Catalog:

Oggetto

Endpoint API

Definizione

Batch

/batches

I batch sono unità di dati costituite da uno o più file da acquisire come una singola unità. Un oggetto batch in Catalog delinea le metriche di acquisizione del batch (ad esempio il numero di record elaborati o la dimensione su disco) e può includere anche collegamenti a set di dati, viste e altre risorse interessate dall’operazione batch.

Set di dati

/dataSets

Un set di dati è un costrutto di archiviazione e gestione per una raccolta di dati, in genere una tabella, che contiene uno schema (colonne) e dei campi (righe). Per ulteriori informazioni, consulta la panoramica dei set di dati.

File di set di dati

/datasetFiles

I file di set di dati rappresentano blocchi di dati salvati in Platform. Come record di file letterali, è qui che si possono trovare la dimensione del file, il numero di record che contiene e un riferimento al batch con cui è stato acquisito il file.

Passaggi successivi

Questo documento fornisce un’introduzione a Catalog Service e come funziona all'interno dell’ambito di applicazione più ampio di Experience Platform. Consulta la Catalog guida per sviluppatori per informazioni su come interagire con i diversi endpoint dell’API di Catalog. È consigliabile consultare anche la guida sul filtraggio dei dati Catalog e seguire le best practice per limitare i dati restituiti nelle risposte API.

recommendation-more-help

c5c02be6-79a3-4a2f-b766-136bffe8b676