資料集總覽
所有成功內嵌至Adobe Experience Platform的資料都會儲存在 Data Lake 作為資料集。 資料集是資料集合的儲存和管理結構,通常是包含方案 (欄) 和欄位 (列) 的表格。 資料集也包含中繼資料,可說明其儲存資料的各個層面。
本檔案提供中資料集的高層級總覽 Experience Platform.
建立資料集和追蹤中繼資料
Catalog Service 是內資料位置和歷程的記錄系統 Experience Platform、和可用來建立及管理資料集。 Catalog 追蹤每個資料集的中繼資料,包括 Experience Data Model (XDM)結構描述資料集符合(下節將加以說明)並擷取至該資料集的記錄數。
請參閱 目錄服務總覽 以取得詳細資訊。
強制資料集資料限制
Experience Data Model (XDM)是標準化的架構,其中 Platform 組織客戶體驗資料。 擷取到的所有資料 Platform 必須符合預先定義的XDM結構描述,才能將其儲存在 Data Lake 作為資料集。
所有資料集都包含XDM架構的參考,這會限制可儲存資料的格式和結構。 嘗試上傳資料到不符合資料集XDM結構的資料集會導致擷取失敗。
如需XDM的詳細資訊,請參閱 XDM系統概覽.
將資料擷取至資料集
Adobe Experience Platform資料擷取代表使用下列多種方法 Platform 從各種來源擷取資料。 無論擷取方法為何,所有成功擷取的資料都會轉換為批次檔案。 批次是多個資料單位,由一或多個要作為一個單位進行內嵌的檔案所組成。然後,這些批次檔案會新增到專用資料集,並儲存在 Data Lake.
請參閱 資料擷取概觀 以取得詳細資訊。
從結構描述套用到資料集的標籤
Adobe Experience Platform資料控管可讓您管理客戶資料,以確保遵守適用於資料使用的法規、限制和政策。 資料控管架構可讓您套用使用標籤,以根據套用至該資料的使用原則來分類資料。 標籤可套用至個別結構描述、這些結構描述內的欄位以及整個個別資料集。 標籤直接套用至結構描述時,這些標籤會傳播至以該結構描述為基礎的所有現有和未來資料集。
請參閱 資料控管概觀 以取得服務的詳細資訊。 有關如何使用中的使用標籤的步驟 Platform,請參閱下列指南:
下游的資料集 Platform 服務
資料集一旦用來儲存擷取的資料後,下游就會使用這些資料集 Platform 更新客戶設定檔、透過機器學習獲得深入分析等功能的服務。
以下是使用資料集進行各種操作的下游服務清單。 如需詳細資訊,請參閱各服務的檔案。
- Data Access API:可讓您存取及下載儲存在資料集中的檔案內容。
- Adobe Experience Platform Identity服務:跨裝置和系統橋接身分,根據資料集符合的XDM結構描述所定義的身分欄位將其連結在一起。
- Real-Time Customer Profile:利用 Identity Service 以即時從資料集建立詳細的客戶設定檔。 Real-Time Customer Profile 從提取資料 Data Lake 並將客戶設定檔儲存在其自己的獨立資料存放區中。
- Adobe Experience Platform Segmentation Service:可讓您建立區段,並從產生對象 Real-Time Customer Profile 資料。 然後,這些對象可匯出至他們在 Data Lake.
- Adobe Experience Platform資料科學工作區:使用機器學習和人工智慧來發掘大型資料集中的深入分析。
- Adobe Experience Platform查詢服務:可讓您使用標準SQL在中查詢資料 Experience Platform,在中聯結任何資料集 Data Lake 並將查詢結果擷取為新資料集,以用於報表, Data Science Workspace,或 Real-Time Customer Profile.
- Adobe Experience Platform目標服務:可讓您 匯出資料集 至您所需的雲端儲存空間或電子郵件行銷目的地,以用於報表或資料科學活動。
後續步驟
閱讀本檔案後,您已經瞭解中資料集的核心用途 Experience Platform,以及各種 Platform 使用資料集的服務。 如需有關資料集使用方式的詳細資訊,請參閱 Platform,請檢閱本總覽中所連結的服務檔案。
如需如何與內的資料集互動的相關步驟, Experience Platform UI,請參閱 資料集使用手冊.