Show Menu
主題×

重複資料刪除

說明

Deduplication 動允許您刪除入站活動結果中的重複項。

使用內容

活動 Deduplication 通常用於定位活動後或匯入檔案後,以及允許使用定位資料之活動前。
在重複資料消除期間,入站轉換會單獨處理。 例如,如果配置檔案'A'出現在查詢1的結果中,也出現在查詢2的結果中,則不會對其進行重複資料消除。
因此,建議重複資料消除只有一個入站過渡。 若要這麼做,您可以使用符合您定位需求的活動(例如聯合活動、交叉點活動等)來結合不同的查詢。 例如:
相關主題

配置

要配置重複資料消除活動,必須輸入標籤、方法和重複資料消除標準,以及與結果相關的選項。
  1. 將活動拖放 Deduplication 到工作流程中。
  2. 選擇活動,然後使用顯示的快 速操作中的按鈕將其開啟。
  3. 選擇必 Resource type 須執行重複資料消除的位置:
    • Database resource 如果對資料庫中已存在的資料執行重複資料消除。 根據 Filtering dimension Targeting dimension ​消除重複的資料,選擇和。 預設情況下,對配置檔案執行重複數 據消除
    • Temporary resource 如果對工作流的臨時資料執行重複資料消除: 選擇包 Targeted set 含要消除重複的資料。 在匯入檔案或資料庫中的資料已豐富(例如使用區段代碼)後,就會遇到此使用案例。
  4. 選擇 Number of unique records to keep 。 此欄位的預設值為1。 值0允許您保留所有重複項。
    例如,如果記錄A和B被視為記錄Y的重複項,而記錄C被視為記錄Z的重複項:
    • 如果欄位的值為1: 只保存Y和Z記錄。
    • 如果欄位的值為0: 所有記錄都保存了。
    • 如果欄位的值為2: 記錄C和Z被保存,並且A、B和Y中的兩條記錄被保存,這是偶然的,或取決於之後選擇的重複資料消除方法。
  5. 在提供的 Duplicate identification 清單中新增條件,以定義標準。 指定允許標識重複值的欄位和/或表達式: 電子郵件地址、名字、姓氏等。 條件的順序允許您指定要首先處理的條件。
  6. 在下拉式清單中,選取要 Deduplication method 使用的:
    • Choose for me : 隨機選擇要從重複項中保留的記錄。
    • Following a list of values : 可讓您定義一或多個欄位的值優先順序。 要定義值,請選擇一個欄位或建立表達式,然後將值添加到相應的表中。 若要定義新欄位,請按一 Add 下值清單上方的按鈕。
    • Non-empty value : 這可讓您保留所選運算式值不為空的記錄作為優先順序。
    • Using an expression : 這可讓您保留輸入的運算式值最小或最大的記錄。
  7. 如有需要,請管理活動的 轉場 ,以存取出站人口的進階選項。
  8. 確認活動的設定並儲存工作流程。