Show Menu
主題×

Customer Data Feeds

有關( Customer Data Feed )檔案CDF的基本資訊,以及如何開始使用的指示。 如果您想要接收檔案或只想要 CDF 更多資訊,請從這裡開始。

檔案內容與用途

CDF 檔案包含的資料與 Audience Manager 事件呼叫 ( /event ) 傳送至我們伺服器的資料相同。This includes data like user IDs, trait IDs, segment IDs, and all the other parameters captured by an event call. 內部 Audience Manager 系統將事件資料處理成 CDF 檔案,內容會組織成以固定順序顯示的欄位。 Audience Manager 嘗試每小時產 CDF 生檔案,並將它們儲存在伺服器上安全、客戶專屬的儲 Amazon S3 存貯體。 我們提供這些檔案,讓您能夠處理 Audience Manager 超出使用者介面所限制的資料。
使用CDF檔案時請注意以下限制:
  • 在設定CDF檔案傳送之前,請確定您擁有第三方資料提供者的適當權限,以匯出第三方特徵。
  • 您不應將檔 CDF 案當做代理來監控頁面流量、協調報表不一致或帳單等。

快速入門

沒有自助服務程式可以啟動檔案 CDF 傳送。 Contact your Audience Manager consultant or Customer Care to get started. 在實施期間,您的 Audience Manager 代表將:
  • 設定儲存 Amazon S3 貯體。
  • 提供唯讀驗證 S3 憑證給您的檔案儲存貯體。 您將無法查看或訪問屬於其他客戶的目錄和檔案。
當檔案通知 CDF 和檔案可供下載時,檔 S3 案通知和檔案會出現在儲存貯體中。 您負責從您指派的目錄監視和下載 S3 檔案。 請參閱 客戶資料摘要檔案處理通知

後續步驟

以下各節及「客 戶資料饋送常見問答」 ,可協助您更熟悉這項服務。

Customer Data Feed 定義的內容

依外觀順序列出並定義檔案中 CDF 的資料元素和陣列。 定義包括資料類型,但此資訊不屬於檔案的一 CDF 部分。

定義

檔 CDF 案包含下列定義的部分或全部欄位。 如需內部檔案組織的詳細資訊,請參 閱客戶資料饋送檔案結構
欄位 資料類型 說明
Event Time
時間戳記
資料收集伺服器(DCS)處理CDF 檔案的時間 。 時間戳記使 用yyyy-mm-dd hh:mm:ss 格式,並在UTC時區中設定。
注意: 事件時 間不 :
Device
字串
這是唯一 使用者ID (UUID),是您網站訪客的38位元裝置ID。 也請參閱 Audience Manager 內的 ID 索引
Container ID
數值
觸發ID的容器ID同步。
Realized Traits
數值陣列
一組特徵ID,包含訪客在事件呼叫中實現(符合)的所有特徵。
請注意,陣列可包含訪客在此事件呼叫前曾符合的特徵,以及重新符合的特徵。
Realized Segments
數值陣列
區段ID的陣列,包含訪客在事件呼叫中實現(符合)的所有區段。
Request Parameters
字串
擷取所有參數(變數、ID、索引鍵值配對、裝置廣告ID等)的字串 在事件呼叫時傳入。
簡短範例:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
字串
反向連結頁面的未編碼URL(如果有)。
IP Data Type
字串
在事件呼叫中擷取之訪客的IP位址。
MCDevice
字串
派給網站訪客的Experience Cloud ID(MID)。 另請參閱 Cookie和Adobe Experience Platform Identity Service
All Segments
數值陣列
區段ID的陣列,包含先前已實現的區段和訪客符合的新區段。
All Traits
數值陣列
一系列第一方和第三方特徵ID,其中包含訪客自上次產生資料饋送以來所符合的先前實現特徵和新特徵。

Customer Data Feed 檔案結構

列出並定義檔案的資料 CDF 結構。 這包括資料順序、欄位分隔字元和分隔符號、資料檔案地圖和範例檔案。

資料欄位識別碼和順序

CDF 檔案不包含已標示的欄或欄位標題。 相反,檔案 CDF 會定義具有非打印字元的欄位和 ASCII 陣列。 此外,檔 CDF 案會依特定順序列出每個欄位和陣列。 瞭解欄位識別碼和順序有助於正確剖析檔案。
CDF檔案元素 說明
欄位分隔符和分隔字元
這些非打印字元定義CDF檔案的元素和結構:
  • Ctrl + a(ASCII 001 ^A )會以非列印空間指標分隔個別欄位中的資料。
  • Ctrl + b(ASCII 002 ^B )可分隔資料和陣列,並請求參數。
  • Ctrl + c(ASCII 003 ^C )定義鍵值對。
欄位順序
重要: Audience Manager 保留在未來發行中新增欄位至CDF檔案結尾的權利。 這表示檔案剖析系統的技術設計不應假設固定數目的欄(雖然它可能會假設現有欄的順序固定)。
CDF檔案中的資料按以下順序顯示。
  1. 事件時間
  2. 裝置
  3. 容器 ID
  4. 實現的特性
  5. 已實現的區段
  6. 要求參數
  7. Referer
  8. IP 位址
  9. Experience Cloud裝置ID(或MID)。 See also, Cookies and the Adobe Experience Platform Identity Service
  10. 所有區段
  11. 所有特徵
如需欄位說明,請參閱「 客戶資料饋送內容定義」

CDF 檔案映射

CDF 檔案資料會依下列順序顯示。

識別陣列

檔案中的數 CDF 組以欄位分隔符開始和 Ctrl + a 結束。 這會使陣列中的第一個元素看起來像獨立的資料欄位。 例如,實現的陣 traits 列從開始 ^A1234 。 陣列分隔字元和ID ^B5678 會遵循此項目。 因此,您可能會想到,已實現陣列中的第一個元素 traits 是ID 5678(因為它以 ^B 開頭)。 但情況並非如此,因此您需要熟悉資料檔案的順序和結構。 即使實現的陣列(或檔案中 trait 的任何其它陣列)中的第一個元素以 CDF ^A 開頭,檔案中的外觀或位置順序仍定義陣列的開頭。 而且,陣列中的第一個元素總是與前面的條目分開 ^A

Sample CDF File

範例檔 CDF 案看起來可能類似下列。 我們在此範例中插入了分行符號,以協助它符合頁面。

Customer Data Feed 檔案命名慣例

以下各節列出並定義檔案名中 CDF 的元素。

CDF 檔案名: 語法與範例

典型的 CDF 檔案名稱包含下列元素。 Note, italics indicates a variable placeholder:

語法

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

範例

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

在您的 S3 儲存貯體中,檔案會依合作夥伴ID(PID)、日和小時的升序排序。

CDF 定義的檔案名元素

下表列出並定義檔案名中 CDF 的元素。
檔案名稱元素 說明
s3://aam-cdf/
這是Amazon S3伺服器上CDF檔案的預設根儲存桶。
your S3 bucket name
唯讀儲存桶的名稱,保存CDF檔案的S3儲存桶。
day= yyyy-mm-dd
您檔案的處理日期。
hour= hh
以24小時記號表示並在UTC時區中設定的時間值。 另請參閱「 客戶資料饋送檔案名稱時間」和「檔案內容時間」... .
partner ID
您的合作夥伴ID。
AAM process ID _0
內部的 Audience Manager 程式ID。
.gz
gzip副檔名。 CDF檔案壓縮為gzip。

Customer Data Feed 檔案處理通知

Audience Manager 將檔 .info 案寫入您 S3 的目錄,以告知您 Customer Data File (CDF)已準備好下載。 檔 .info 案也包含 JSON 檔案內容的格式化中繼資 CDF 料。 請檢閱本節,以取得有關此通知檔案所使用之語法和欄位的資訊。

範例資訊檔案

每個 .info 檔案都包含 Files Totals 區段。 該 Files 區段包含一個陣列,其中包含每個每小時檔案的特定度量。 該 Totals 區段包含匯總至您所有特定日 CDF 期檔案的量度。 您檔案的內 .info 容看起來可能類似下列範例。
{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

定義的資訊檔案欄位

下表列出並定義檔案中的 CDF .info 元素。

檔案對象

欄位 說明
Files
啟動包含有關CDF檔案的元資料的陣列。
FileByteSize
檔案大小(以位元組為單位)。
FileChecksumMD5
Amazon S3 ETag。 連字型大小後面的數字顯示在多部件上載期間用於生成檔案的部件數。 與 ETag 檔案的MD5校驗和不相同。
FileName
FileSequenceNumber
每個檔案的索引號。

總計物件

欄位 說明
Totals
啟動包含所有CDF檔案的聚合資料的對象。
Day
資料可用的日期。 使用 yyyy-mm-dd格式
Hour
資料可用的小時數。 使用在UTC時區中設定的24小時格式。
TotalByteSize
該日期所有CDF檔案的總大小(以位元組為單位)。
TotalNumberFiles
上傳到S3目錄的檔案總數。

Customer Data Feed 檔案名時間和檔案內容時間不同

您的 CDF 檔案在檔案名稱和檔案內容中包含時間戳記。 這些時間戳記會記錄相同檔案的不同事件 CDF 程式。 相同檔案的名稱和內容中會出現不同的時間戳記,這種情況並不少見。 瞭解每個時間戳記有助於您避免在處理此資料或嘗試依時間排序時常出錯。

查找 CDF 檔案時間戳

CDF 檔案在2個不同位置記錄的時間不同。

瞭解時間戳記之間的差異

下表提供檔案時間戳記的其 CDF 他詳細資訊,以及如何正確使用時間戳記的資訊。
時間戳記位置
說明
檔案名稱
檔案名稱中的 CDF 時間戳記會標示開始準備 Audience Manager 檔案進行傳送的時間。 此時間戳記設定在時 UTC 區中。 它使用參 hour= 數,時間格式為24小時記號的2位數小時。 此時間可以與檔案內容中記錄的事件時間不同。 使用檔案 CDF 時,有時您會發現您的儲 S3 存貯體在特定小時內空白。 空桶表示可以表示以下任一項:
  • 沒有那個小時的資料。
  • 我們的伺服器負載繁重,無法處理特定小時的檔案。 當伺服器接上來時,會將原本應在較早時段檔案中的檔案,放入具有較晚時間值的儲存貯體中。 例如,當本應在17小時儲存貯體中的檔案出現在18小時儲存貯體中時(在檔案名稱中),您就會 hour=18 看到這一點。 在這種情況下,伺服器可能會在17小時內開始處理您的檔案,但無法在該時間間隔內完成。 相反地,檔案會推送至下一個每小時時段。
重要​ : 請勿使用檔案名稱時間戳記依時間來分組事件。 如果您需要依時間分組,請使用檔 EventTime 案內容中的時間戳記。
檔案內容
檔案內容中的 CDF 時間戳記會標示開始處理 Data Collection Servers 檔案的時間。 此時間戳記設定在時 UTC 區中。 它使用字 EventTime 段,時間格式為 yyyy-mm-dd hh:mm:ss 。 此時間接近頁面上事件的實際時間,但可能與檔案名稱中的小時指示符不同。
提示 : 與檔案 hour= 名稱中的時間戳記不同,您可以 EventTime 使用時間來分組資料。