Show Menu
主題×

瞭解資料集建構

Adobe資料集包含資料工作台伺服器已載入和處理的資料。
資料工作台伺服器(InsightServer64.exe)載入和處理資料的步驟構成資料集建構程式。
處理和服務來自Adobe資料集的資料工作台伺服器稱為資料處理單元或DPU。 它有時稱為處理伺服器或查詢伺服器。 資料工作台和 Report 客戶直接與DPU互動。
在資料集建構期間,資料工作台伺服器會從記錄來源讀取來源資料,將轉換套用至特定資料欄位,並定義要從轉換欄位建立的延伸維度。 施工過程分為兩個階段:日 志處理 轉換 。 建立資料集後,您可以使用資料集的延伸維度來建立衍生量度和維度,以利您進行特定分析。
資料集建構就像製造過程。 您選取要用來建立資料集的資料(原材料),並定義資料轉換(處理步驟),以控制資料中可用的資訊,以建立延伸尺寸(製造產品)。
對日誌進行過濾,並標識要傳遞到轉換階段的資料欄位。 在記錄處理階段結束時,資料會依追蹤ID分組(亦即,所有具有相同追蹤ID的記錄項目都會分組在一起),並依時間排序。 在日誌處理階段,您無法訪問要用於分析的已處理資料。

指定日誌源

日誌源是包含用於構建資料集的資料的檔案。 日誌源中可用的資料稱為事件資料,因為每個資料記錄代表事務記錄或事件的單個實例。 此外,每個記錄或記錄項目都包含一個稱為追蹤ID的值。
選取記錄檔來源時,請確定每個記錄檔項目都包含實體的追蹤ID,該ID代表您的資料要分組的最高層級。 例如,如果您使用從網站流量收集到的資料,則可能會選擇訪客為此實體。 每個訪客都有唯一的追蹤ID,而且特定網站訪客的所有資料都可以分組在一起。 如需協助,請聯絡Adobe。
記錄來源事件資料由Insight Server透過封存的資料來 Sensors 源即時收集或擷取。 感測器從HTTP和應用程式伺服器收集的事件資料會傳送至Insight Servers,Insight Servers會將資料轉換為高度壓縮的記錄檔( .vsl)檔案。 駐留在平面檔案、XML檔案或ODBC資料源中的事件資料由Insight Server讀取,Insight Server提供瞭解碼器,您可以定義解碼器,以便從這些不同格式中抽取一組常用的日誌欄位。

定義轉換

轉換是一組指令,您可以定義這些指令來擷取或控制事件資料中的資訊。 您定義的每個轉換都會套用至每個事件資料記錄(記錄項目),以更新現有的記錄欄位或產生新欄位。 轉換結果與日誌條目條件一起使用,以評估在日誌處理期間從資料集中過濾哪些日誌條目。
在資料集建構程式的對數處理階段,並非所有類型的轉換都可使用。

篩選記錄檔

資料集包含數個參數,用以篩選轉換中流出的資料。 篩選用於指定在後續處理步驟中使用哪些日誌條目。 例如,篩選器可以由、時間範圍、伺服器響應的狀態或IP地址和用戶代理資訊定義。 這是 Log Entry Condition 可自訂的篩選測試。 測試會在每個記錄項目的欄位中尋找特定條件,以判斷該項目是否應在資料集建構程式中更進一步。 如果日誌條目不符合條件,則從構建過程中刪除該條目。

標識轉換欄位

如果要將資料欄位從日誌處理階段傳遞到轉換階段以進行進一步處理,則必須在日誌處理過程中標識該欄位。 無論欄位是否可從日誌源中使用,或是通過在日誌處理期間應用於資料的資料轉換建立,都適用此要求。
在資料集構建的轉換階段,對從日誌處理輸出的分組和有序資料進行處理。 會執行其他資料轉換,並建立擴充的資料維度以用於分析。 在轉換階段,您可以存取隨著轉換階段接近完成而變大的資料統計樣本。

定義轉換

您可以定義在資料集構建過程的轉換階段中使用的轉換,以便建立擴展維。 每個轉換都會套用至記錄處理傳遞的每個事件資料記錄(記錄項目)。

篩選記錄檔

在轉 Log Entry Condition 換期間可應用該選項,以在日誌處理產生的每個日誌條目的欄位中查找特定條件。 如果日誌條目不符合條件,則從構建過程中刪除該條目。

定義擴展尺寸

擴展維是資料集構建過程的最終產物。 它們代表資料中記錄欄位之間的關係。 您可使用它們來建立視覺化、建立擴充量度,或執行分析,以瞭解您業務的特定運作和問題。