Show Menu
トピック×

カタログサービスの概要

カタログサービスは、Adobe Experience Platform内のデータの場所と系列の記録システムです。 Experience Platformに取り込まれるすべてのデータは、ファイルやディレクトリとしてData Lakeに保存されますが、Catalogには、参照や監視のためにこれらのファイルやディレクトリのメタデータと説明が保持されます。
簡単に言うと、カタログはメタデータストア(カタログ)の役割を果たし、エクスペリエンスプラットフォーム内でデータに関する情報を見つけることができます。 カタログを使用すると、次の質問に答えることができます。
  • データの場所
  • このデータは処理のどの段階ですか。
  • データに対してどのようなシステムまたはプロセスが作用したか。
  • 正常に処理されたデータ量。
  • 処理中に発生したエラー
カタログは、基本的なCRUD操作を使用してプラットフォームメタデータをプログラムで管理できるRESTful APIを提供します。 詳しくは、 カタログ開発ガイド を参照してください。

カタログとエクスペリエンスプラットフォームサービス

Catalog Serviceで追跡されるリソースは、複数のExperience Platformサービスで使用されます。 Catalogの機能を最大限に活用するために、これらのサービスとCatalogとのやり取りについて理解することをお勧めします。

エクスペリエンスデータモデル(XDM)システム

エクスペリエンスデータモデル(XDM)システムは、プラットフォームが顧客エクスペリエンスデータを編成する際に使用する標準化されたフレームワークです。 Experience Platformは、XDMスキーマを利用して、一貫性のある再利用可能な方法でデータの構造を記述します。
データがPlatformに取り込まれると、そのデータの構造がXDMスキーマにマッピングされ、データ セットの一部としてData Lake内に保存されます 。 各データセットのメタデータは、Catalog Serviceによって追跡されます。この中には、データセットが準拠するXDMスキーマへの参照が含まれています。
XDMシステムの一般情報について詳しくは、 XDMシステムの概要を参照してください

データ収集

エクスペリエンスプラットフォームは、複数のソースからデータを取り込み、レコードをデータレーク内のデータセットとして保持します。 カタログは、取り込み元や取り込み方法に関係なく、これらのデータセットのメタデータを追跡します。
バッチ取り込み方法を使用する場合、Catalogは バッチ ファイルの追加のメタデータも追跡します。 バッチとは、1つの単位として取り込まれる1つ以上のファイルで構成されるデータの単位です。 カタログは、これらのバッチファイルのメタデータと、取り込み後も保持されるデータセットを追跡します。 バッチメタデータには、正常に取り込まれたレコードの数、失敗したレコードおよび関連するエラーメッセージに関する情報が含まれます。
See the data ingestion overview for more information.

カタログオブジェクト

前の節で説明したように、Catalogは、他のプラットフォームサービスで使用されるいくつかの種類のリソースおよび操作のメタデータを追跡します。 カタログは、このメタデータをカプセル化する「オブジェクト」の独自のストアを維持します。 カタログオブジェクトは、プラットフォームデータをクエリー可能に表したもので、データ自体にアクセスする必要なく、データの検索、監視、ラベル付けを行うことができます。
次の表に、カタログでサポートされる各種オブジェクトの概要を示します。
オブジェクト
APIエンドポイント
定義
アカウント
/accounts
ソース接続を作成する場合は、認証資格情報を指定する必要があります。 アカウントは、特定の種類の接続の作成に使用された認証資格情報のコレクションを表します。 各接続には、Catalogで保持され、Azure Key Vaultに保護される一意のパラメーターのセットがあります。
バッチ
/batches
バッチとは、1つの単位として取り込まれる1つ以上のファイルで構成されるデータの単位です。 カタログ内のバッチオブジェクトは、バッチの取り込み指標(ディスク上で処理されたレコード数やサイズなど)の概要を示し、バッチ処理の影響を受けたデータセット、表示、その他のリソースへのリンクを含む場合があります。
接続
/connections
接続とは、組織に固有で、コネクタタイプに対して適切な認証資格情報を使用して設定された、ソースコネクタの単一のインスタンスです。
コネクタ
/connectors
コネクターは、他のアドビアプリケーション(Adobe AnalyticsやAdobeオーディエンスマネージャーなど)、サードパーティのクラウドストレージソース(Azure Blob、Amazon S3、FTPサーバー、SFTPサーバーなど)、およびサードパーティのCRMシステム(Microsoft DynamicsやSalesforceなど)からデータを収集するソース接続の方法を定義します。
データセット
/dataSets
データセットは、スキーマ(列)とフィールド(行)を含むデータ(通常はテーブル)の収集に使用されるストレージと管理の構成体です。
データセットファイル
/datasetFiles
データセットファイルは、プラットフォームに保存されたデータのブロックを表します。 リテラルファイルの記録として、ファイルのサイズ、ファイルに含まれるレコード数、ファイルを取り込んだバッチへの参照を確認できます。

次の手順

このドキュメントでは、カタログサービスと、より広範なエクスペリエンスプラットフォーム内でのその機能について説明しました。 そのカタログAPIの様々なエンドポイントとの対話手順については、 カタログ開発者ガイド を参照してください。 API応答で返されるデータを制限するベストプラクティスに従うため、カタログデータの フィルタリングに関するガイドも参照することをお勧めします