중복 제거 deduplication

설명 description

Deduplication 활동을 통해 인바운드 활동의 결과에서 중복을 삭제할 수 있습니다.

사용 컨텍스트 context-of-use

일반적으로 Deduplication 활동은 다음의 타겟팅 활동 또는 파일을 가져온 후 타겟팅된 데이터를 사용할 수 있는 활동 전에 사용됩니다.

중복을 제거하는 동안 인바운드 전환이 개별적으로 처리됩니다. 예를 들어, 프로필 'A'가 쿼리 1의 결과에 있고 쿼리 2의 결과에도 있는 경우 중복 제거되지 않습니다.

따라서 중복 제거에는 인바운드 전환이 하나만 있는 것이 좋습니다. 이를 위해 조합 활동, 교차 활동 등과 같은 타겟팅 요구에 해당하는 활동을 사용하여 서로 다른 쿼리를 결합할 수 있습니다. 예제:

관련 항목

구성 configuration

중복 제거 활동을 구성하려면 결과와 관련된 옵션뿐만 아니라 레이블, 방법 및 중복 제거 기준을 입력해야 합니다.

  1. Deduplication 활동을 워크플로우로 끌어서 놓습니다.

  2. 활동을 선택한 다음 나타나는 빠른 작업에서 버튼을 사용하여 활동을 엽니다.

  3. 중복 제거를 수행할 Resource type ​을(를) 선택합니다.

    • 중복 제거가 데이터베이스에 이미 존재하는 데이터에 대해 수행되는 경우 Database resource ​을(를) 선택합니다. 중복을 제거하려는 데이터에 따라 Filtering dimensionTargeting dimension ​을(를) 선택합니다. 기본적으로 중복 제거는 프로필 ​에서 수행됩니다.
    • 워크플로우의 임시 데이터에서 중복 제거가 수행되는 경우 Temporary resource ​을(를) 선택합니다. 중복을 제거하려는 데이터가 포함된 Targeted set ​을(를) 선택합니다. 이 사용 사례는 파일을 가져온 후 또는 데이터베이스의 데이터가 보강된 경우(예: 세그먼트 코드 포함) 발생할 수 있습니다.
  4. Number of unique records to keep ​을(를) 선택합니다. 이 필드의 기본값은 1입니다. 값 0을 사용하면 모든 중복을 유지할 수 있습니다.

    예를 들어 레코드 A와 B가 레코드 Y의 중복으로 간주되고 레코드 C가 레코드 Z의 중복으로 간주되는 경우:

    • 필드의 값이 1인 경우 레코드 Y와 Z만 유지됩니다.
    • 필드의 값이 0인 경우 모든 레코드가 유지됩니다.
    • 필드의 값이 2인 경우 레코드 C와 Z는 유지되고 A, B 및 Y의 두 레코드는 우연히 또는 이후에 선택한 중복 제거 방법에 따라 유지됩니다.
  5. 제공된 목록에 조건을 추가하여 Duplicate identification 기준을 정의합니다. 이메일 주소, 이름, 성 등 동일한 값에서 중복을 식별할 수 있는 필드 및/또는 표현식을 지정합니다. 조건 순서를 사용하면 먼저 처리할 항목을 지정할 수 있습니다.

  6. 드롭다운 목록에서 사용할 Deduplication method ​을(를) 선택합니다.

    • Choose for me: 중복 중에서 유지할 레코드를 임의로 선택합니다.

    • Following a list of values: 하나 이상의 필드에 대한 값 우선 순위를 정의할 수 있습니다. 값을 정의하려면 필드를 선택하거나 표현식을 만든 다음 해당 테이블에 값을 추가합니다. 새 필드를 정의하려면 값 목록 위에 있는 Add 버튼을 클릭합니다.

    • Non-empty value: 선택한 표현식의 값이 비어 있지 않은 레코드를 우선 순위로 유지할 수 있습니다.

    • Using an expression: 입력한 표현식의 값이 가장 작거나 가장 큰 레코드를 유지할 수 있습니다.

  7. 필요한 경우 활동의 전환을 관리하여 아웃바운드 모집단에 대한 고급 옵션에 액세스합니다.

  8. 활동 구성을 확인하고 워크플로우를 저장합니다.

recommendation-more-help
3ef63344-7f3d-48f9-85ed-02bf569c4fff