Customer Data Feeds customer-data-feeds
有關 Customer Data Feed (CDF)檔案和有關如何開始的說明。 如果您有興趣接收 CDF 檔案或只是想要更多資訊。
檔案內容和用途 file-contents-purpose
CDF 檔案包含的資料與 Audience Manager 事件呼叫 (/event
) 傳送至我們伺服器的資料相同。包括用戶ID等資料, trait IDs。 segment IDs,以及事件調用捕獲的所有其他參數。 內部 Audience Manager 系統將事件資料處理到 CDF 檔案,其內容組織為按設定順序顯示的欄位。 Audience Manager 嘗試生成 CDF 每小時歸檔,並將它們儲存在一個安全、特定於客戶的儲存桶中 Amazon S3 伺服器。 我們提供這些檔案,以便您能夠 Audience Manager 超出用戶介面限制的資料。
- 在設定CDF檔案傳送之前,請確保您具有第三方資料提供商對導出第三方特徵的適當權限。 Audience Manager當前不支援用戶介面中向第三方資料提供程式請求CDF檔案傳遞導出權限的功能,因此請獨立聯繫他們。
- 你不該 CDF 檔案作為代理來監視頁流量、協調報表差異或計費等。
快速入門 getting-started
沒有要啟動的自助服務進程 CDF 檔案傳遞。 聯繫您 Audience Manager 咨詢顧問或客戶服務開始。 在實施過程中, Audience Manager 代表:
- 設定 Amazon S3 儲存桶。
- 提供只讀 S3 檔案儲存儲存桶的身份驗證憑據。 您將無法查看或訪問屬於其他客戶的目錄和檔案。
檔案通知和 CDF 檔案將出現在 S3 當它們準備下載時儲存。 您負責監視和下載分配的檔案 S3 的子菜單。 請參閱客戶資料摘要檔案處理通知。
後續步驟 next-steps
以下各節和 客戶資料源常見問題 可以幫助您更熟悉此服務。
Customer Data Feed 定義的內容 cdf-defined
列出並定義 CDF 按外觀順序排列。 定義包括資料類型,但此資訊不是 CDF 的子菜單。
定義 definitions
A CDF 檔案包含下面定義的部分或全部欄位。 有關內部檔案組織的資訊,請參見 客戶資料饋送檔案結構。
Event Time
CDF檔案由 資料收集伺服器 (DCS)。 時間戳使用 yyyy-mm-dd hhss 格式,並在UTC時區中設定。
注:事件時間 不是:
- 頁面事件或事件的時間自行調用,儘管它可能接近這些時間。
- 與檔案名中的DCS小時相關。 另請參見 客戶資料饋送檔案名時間和檔案內容時間……。
Container ID
Realized Traits
一組特性ID,包含訪問者在事件調用中實現(限定)的所有特性。
請注意,陣列可以包含訪問者以前已通過此事件調用確認的特徵,以及通過此事件調用重新確認這些特徵。
Realized Segments
Request Parameters
捕獲所有參數(變數、ID、鍵值對、設備通告ID等)的字串 在事件呼叫中傳入。
縮寫示例:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
All Segments
All Traits
Customer Data Feed 檔案結構 cdf-file-structure
列出並定義 CDF 的子菜單。 這包括資料序列、欄位分隔符和分隔符、資料檔案映射和示例檔案。
資料欄位標識符和序列 identifiers-and-sequence
CDF 檔案不包含已標籤的列或欄位標題。 相反, CDF 檔案定義欄位和陣列,但不打印 ASCII 字元。 另外, CDF 檔案按特定順序列出每個欄位和陣列。 瞭解欄位標識符和順序將幫助您正確分析檔案。
這些非打印字元定義CDF檔案的元素和結構:
- Ctrl + a(ASCII)
001
或^A
)使用非打印空間指示器分隔各個欄位中的資料。 - Ctrl + b(ASCII)
002
或^B
)分離資料和陣列和請求參數。 - Ctrl + c(ASCII)
003
或^C
)定義鍵值對。
重要提示: Audience Manager 保留在將來版本中將新欄位添加到CDF檔案末尾的權利。 這意味著檔案分析系統的技術設計不應假定列數固定(儘管它可能假定現有列的順序固定)。
CDF檔案中的資料按如下所示的順序顯示。/N可能會代替這些欄位中的任何一個,表示空值。
- 事件時間
- 裝置
- 容器 ID
- 已實現的特性
- 已實現的段
- 要求參數
- Referer
- IP 位址
- Experience Cloud設備ID(或MID)。 另請參見 Cookie和Adobe Experience Platform身份服務
- 所有段
- 所有特徵
有關欄位說明,請參見 已定義客戶資料饋送內容。
CDF 檔案映射 cdf-file-map
CDF 檔案資料按如下所示的順序顯示。
識別陣列
在 CDF 檔案以開頭和結尾 Ctrl + a
欄位分隔符。 這使陣列中的第一個元素看起來像獨立資料欄位。 例如, traits 陣列開始於 ^A1234
。 陣列分隔符和ID ^B5678
在此條目後。 因此,你可能會忍不住認為,在已實現的 traits 陣列為ID 5678(因為它以 ^B
)。 但情況並非如此,因此您需要熟悉資料檔案的順序和結構。 即使實現 trait 陣列(或 CDF 檔案)開頭 ^A
,檔案中外觀或位置的順序定義陣列的開始。 並且,陣列中的第一元素總是通過 ^A
。
示例 CDF 檔案 sample-file
示例 CDF 檔案可能與以下內容類似。 我們已在此示例中插入換行符,以幫助它適應頁面。
Customer Data Feed 檔案命名約定 cdf-naming-conventions
下面的部分列出並定義 CDF 檔案名。
CDF 檔案名:語法和示例 cdf-file-name
典型 CDF 檔案名包含下面列出的元素。 注意, 斜體 指示變數佔位符:
語法
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
範例
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
在 S3 儲存桶,檔案按合作夥伴ID(PID)、日和小時。
CDF 定義的檔案名元素 cdf-file-name-elements
下表列出並定義 CDF 檔案名。
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed 檔案處理通知 cdf-file-processing-notifications
Audience Manager 寫 .info
檔案 S3 目錄,通知您 Customer Data File (CDF)已準備好下載。 的 .info
檔案也包括 JSON 格式化元資料,關於您的 CDF 的子菜單。 有關此通知檔案使用的語法和欄位的資訊,請查看本節。
示例資訊檔案 sample-info-file
每個 .info
檔案包含 Files
和 Totals
的子菜單。 的 Files
節包含一個陣列,該陣列保存每個小時檔案的特定度量。 的 Totals
部分包含所有 CDF 檔案。 您的 .info
檔案可能與以下示例類似。
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
定義的資訊檔案欄位 info-file-fields-defined
下表列出並定義 CDF .info
的子菜單。
檔案對象
Files
FileByteSize
FileChecksumMD5
ETag
與檔案的MD5校驗和不相同。FileName
FileSequenceNumber
總計對象
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed 檔案名時間和檔案內容時間不同 different-processing-times
您 CDF 檔案包含檔案名和檔案內容中的時間戳。 這些時間戳記錄相同事件的不同進程 CDF 的子菜單。 在同一檔案的名稱和內容中看到不同的時間戳的情況並不少見。 瞭解每個時間戳有助於避免在處理此資料或嘗試按時間排序時出現的常見錯誤。
定位 CDF 檔案時間戳 locating-timestamps
CDF 檔案在兩個不同位置記錄的時間不同。
理解時間戳的區別 understanding-timestamps
下表提供了有關您的 CDF 檔案時間戳以及有關如何正確使用它們的資訊。
您的時間戳 CDF 檔案名標籤 Audience Manager 已開始準備檔案以供傳遞。 此時間戳在 UTC 時區。 它使用 hour=
參數,時間格式為2位小時,以24小時表示。 此時間可以不同於檔案內容中記錄的事件時間。 使用時 CDF 檔案,有時你會發現 S3 桶在特定小時內是空的。 空桶裝置可以表示以下任一種:
- 沒有那個小時的資料。
- 我們的伺服器負載很重,無法處理特定小時的檔案。 當伺服器趕上時,它會將本應放在較早時段檔案中的檔案放入具有稍後時間值的儲存桶中。 例如,在18小時儲存桶中出現本應在17小時儲存桶中的檔案時,您會看到這一點(帶
hour=18
的子菜單。 在這種情況下,伺服器可能在17小時內開始處理您的檔案,但無法在該時間間隔內完成。 相反,檔案會被推入到下一個小時時段。
重要:不要使用檔案名時間戳按時間對事件進行分組。 如果需要按時間分組,請使用 EventTime
檔案內容中的時間戳。
EventTime
欄位,其格式為 yyyy-mm-dd hh:mm:ss
。 此時間接近頁面上事件的實際時間,但可能與檔案名中的小時指示器不同。提示:與
hour=
在檔案名中,您可以使用 EventTime
按時間分組資料。