Show Menu
ARGOMENTI×

Catalog Service - Panoramica

Catalog Service è il sistema di record per la posizione dei dati e la linea di dati in Adobe Experience Platform. Anche se tutti i dati in cui Experience Platform viene effettuato il caricamento vengono memorizzati Data Lake come file e directory, Catalog contiene i metadati e la descrizione di tali file e directory a scopo di ricerca e monitoraggio.
In poche parole, Catalog funge da archivio di metadati o "catalogo" in cui è possibile trovare informazioni sui dati all'interno Experience Platform. Potete usare Catalog per rispondere alle seguenti domande:
  • Dove si trovano i miei dati?
  • In quale fase di elaborazione si trovano questi dati?
  • Quali sistemi o processi hanno agito sui miei dati?
  • Quanti dati sono stati elaborati correttamente?
  • Quali errori si sono verificati durante l'elaborazione?
Catalog fornisce un RESTful API che consente di gestire Platform i metadati a livello di programmazione utilizzando le operazioni CRUD di base. Per ulteriori informazioni, consulta la guida per gli sviluppatori del catalogo.

Catalog e Experience Platform servizi

Le risorse che Catalog Service tengono traccia vengono utilizzate da più Experience Platform servizi. Per sfruttare al massimo Catalog's le funzionalità, si consiglia di acquisire familiarità con questi servizi e con come interagiscono con Catalog.

Experience Data Model Sistema (XDM)

Experience Data Model (XDM) Il sistema è il framework standardizzato tramite il quale Platform vengono organizzati i dati sull'esperienza del cliente. Experience Platform sfrutta gli schemi XDM per descrivere la struttura dei dati in modo coerente e riutilizzabile.
Quando i dati vengono assimilati in Platform, la struttura di tali dati viene mappata su uno schema XDM e memorizzata all'interno di Data Lake un dataset. I metadati per ogni dataset vengono tracciati da Catalog Service, che include un riferimento allo schema XDM a cui è conforme il dataset.
Per ulteriori informazioni generali sul sistema XDM, vedere la panoramica del sistema XDM.

Data Ingestion

Experience Platform acquisisce i dati da più origini e persiste come insiemi di dati all'interno dell' Data Lake. Catalog tiene traccia dei metadati per questi set di dati, indipendentemente dalla loro origine o dal metodo di assimilazione.
Quando si utilizza il metodo di assimilazione batch, Catalog vengono inoltre tracciati i metadati aggiuntivi per i file batch. I batch sono unità di dati costituite da uno o più file da acquisire come una singola unità. Catalog tiene traccia dei metadati per questi file batch, nonché dei set di dati in cui sono persistenti dopo l’assimilazione. I metadati batch includono informazioni sul numero di record acquisiti con successo, nonché eventuali record con errore e messaggi di errore associati.
Per ulteriori informazioni, consulta la panoramica sull’assimilazione dei dati.

Catalog objects

Come descritto nella sezione precedente, Catalog tiene traccia dei metadati relativi a diversi tipi di risorse e operazioni utilizzate da altri Platform servizi. Catalog mantiene un proprio archivio di "oggetti" che racchiudono questi metadati. Catalog gli oggetti sono rappresentazioni di Platform dati interrogabili che consentono di eseguire ricerche, monitorare ed etichettare i dati senza dover accedere ai dati stessi.
La tabella seguente delinea i diversi tipi di oggetti supportati da Catalog:
Oggetto
Endpoint API
Definizione
Account
/accounts
Durante la creazione di connessioni di origine, è necessario fornire le credenziali di autenticazione. Un account rappresenta una raccolta di credenziali di autenticazione utilizzate per creare una connessione di un tipo specifico. Ogni connessione ha un insieme di parametri univoci che sono persistenti da Catalog e protetti in un Azure Key Vault.
Batch
/batches
I batch sono unità di dati costituite da uno o più file da acquisire come una singola unità. Un oggetto batch in Catalog descrive le metriche di assimilazione del batch (come il numero di record elaborati o le dimensioni su disco) e può includere anche collegamenti a set di dati, viste e altre risorse interessate dall'operazione batch.
Connessione
/connections
Una connessione è una singola istanza di un connettore di origine, univoca per la propria organizzazione e configurata utilizzando le credenziali di autenticazione appropriate per il tipo di connettore.
Connettore
/connectors
I connettori definiscono il modo in cui le connessioni di origine devono raccogliere dati da altre applicazioni Adobe (come Adobe Analytics e Adobe Audience Manager), origini di archiviazione cloud di terze parti (come Azure Blob, server Amazon S3, server FTP e server SFTP) e sistemi CRM di terze parti (come Microsoft Dynamics e Salesforce).
Set di dati
/dataSets
Un dataset è un costrutto di storage e gestione utilizzato per la raccolta di dati (in genere una tabella) che contiene uno schema (colonne) e campi (righe). Per ulteriori informazioni, vedere la panoramica dei set di dati.
File di set di dati
/datasetFiles
I file di set di dati rappresentano blocchi di dati salvati in Platform. Come record di file letterali, questi sono i punti in cui è possibile trovare la dimensione del file, il numero di record in cui contiene e un riferimento al batch in cui è stato assimilato il file.

Passaggi successivi

Questo documento ha fornito un'introduzione a Catalog Service e come funziona all'interno dell'ambito maggiore di Experience Platform. Consultate la guida Catalog per gli sviluppatori per i passaggi sull'interazione con i diversi endpoint di tale Catalog API. Si consiglia inoltre di fare riferimento alla guida sul filtro dei dati catalogo per seguire le procedure ottimali per limitare i dati restituiti nelle risposte API.