중복 제거 deduplication
중복 제거는 인바운드 활동의 결과에서 중복을 삭제합니다. 중복 제거는 이메일 주소, 전화 번호 또는 다른 필드에서 수행할 수 있습니다.
다음 Deduplication 활동은 데이터 세트에서 중복 행을 제거하는 데 사용됩니다. 예를 들어, 아래 레코드는 동일한 이메일 주소 및 동일한 모바일 및/또는 홈 전화를 가지므로 중복으로 간주될 수 있습니다.
다음 Deduplication 활동에는 중복이 식별된 후 전체 행을 고유 레코드로 유지하는 기능이 있습니다. 예를 들어 위의 사용 사례에서 활동이 가장 오래된 레코드만 유지하도록 구성된 경우 Date, 결과는 다음과 같습니다.
선택한 주 레코드는 중복 행의 다른 관련 데이터와 필드 데이터를 병합하지 않고 데이터를 전달합니다.
보조 항목:
모범 사례 best-practices
중복 제거 동안 인바운드 흐름이 별도로 처리됩니다. 예를 들어 수신자 A가 쿼리 2의 결과와 쿼리 1의 결과에 있는 경우 중복 제거되지 않습니다.
이 문제는 다음과 같이 해결해야 합니다.
- 만들기 합집합 활동을 통해 각 인바운드 흐름을 통합합니다.
- 만들기 중복 제거 다음 이후 활동 합집합 활동.
구성 configuration
중복 제거를 구성하려면 해당 레이블, 방법, 중복 제거 기준 및 결과에 대한 옵션을 입력합니다.
-
다음을 클릭합니다. Edit configuration… 중복 제거 모드를 정의하는 링크입니다.
-
이 활동에 대한 대상 유형(기본적으로 중복 제거는 수신자에게 연결됨)과 사용할 기준(즉, 동일한 값을 사용하여 중복을 식별할 수 있는 필드)을 선택합니다.
note note NOTE 외부 파일 등의 외부 데이터를 입력으로 사용하는 경우 Temporary schema 옵션을 선택합니다. 다음 단계에서는 Other 옵션을 사용하면 사용할 기준 또는 기준을 선택할 수 있습니다. -
다음 단계에서는 Other 옵션을 사용하면 동일한 값의 경우 사용할 기준이나 기준을 선택할 수 있습니다.
-
드롭다운 목록에서 사용할 중복 제거 방법을 선택하고, 유지할 중복 항목 수를 입력합니다.
다음 방법을 사용할 수 있습니다.
-
Choose for me: 중복 중에서 유지할 레코드를 임의로 선택합니다.
-
Following a list of values: 하나 이상의 필드에 대한 값 우선 순위를 정의할 수 있습니다. 값을 정의하려면 필드를 선택하거나 표현식을 만든 다음 해당 테이블에 값을 추가합니다. 새 필드를 정의하려면 값 목록 위에 있는 Add 버튼을 클릭합니다.
-
Non-empty value: 선택한 표현식의 값이 비어 있지 않은 레코드를 우선 순위로 유지할 수 있습니다.
-
Using an expression: 주어진 표현식의 가장 낮은(또는 가장 높은) 값을 갖는 레코드를 유지할 수 있습니다.
note note NOTE 다음 Merge 기능, 를 통해 액세스 가능 Advanced parameters 링크를 사용하면 필드나 필드 그룹을 단일 결과 데이터 레코드로 병합하기 위해 규칙 세트를 구성할 수 있습니다. 자세한 내용은 필드를 단일 레코드로 병합. -
-
클릭 Finish 선택한 중복 제거 방법을 승인합니다.
창의 중간 섹션에 정의된 구성이 요약됩니다.
활동 편집기 창의 아래 섹션에서 그래픽 객체의 아웃바운드 전환에 대한 레이블을 수정하고 활동 결과와 연결할 세그먼트 코드를 입력할 수 있습니다. 이 코드는 나중에 타깃팅 기준으로 사용할 수 있습니다.
-
다음 확인: Generate complement 나머지 모집단을 활용하려면 옵션을 선택합니다. 보완은 모든 중복으로 구성됩니다. 그런 다음 다음과 같이 추가 전환이 활동에 추가됩니다.
예: 게재 전 중복 항목 식별 example--identify-the-duplicates-before-a-delivery
다음 예에서는 중복 제거가 세 쿼리의 통합과 관련이 있습니다.
워크플로우의 목표는 동일한 수신자에게 여러 번 보내지 않도록 중복을 제외하여 게재 대상을 정의하는 것입니다.
식별된 복제본은 전용 복제 목록에도 통합되어 필요한 경우 재사용할 수 있습니다.
-
위에 표시된 대로 워크플로우가 작동하는 데 필요한 다양한 활동을 추가하고 연결합니다.
결합 활동은 여기에서 세 개의 쿼리를 하나의 전환으로 "통합"하는 데 사용됩니다. 따라서 중복 제거는 각 쿼리에 대해 개별적으로 작동하지 않고 쿼리 전체에 대해 작동합니다. 이 주제에 대한 자세한 내용은 우수 사례.
-
중복 제거 활동을 연 다음 Edit configuration… 중복 제거 모드를 정의하는 링크입니다.
-
새 창에서 다음을 선택합니다. Database schema.
-
선택 수신자 타겟팅 및 필터링 차원으로 사용됩니다.
-
에 대한 ID 필드 선택 Email 중복을 사용하여 모든 이메일 주소에 게재를 한 번만 보낸 다음 Next.
특정 필드에 중복 ID를 적용하려면 다음을 선택합니다. Other 사용 가능한 필드 목록에 액세스합니다.
-
여러 수신자에 대해 동일한 이메일 주소가 식별되는 경우 하나의 항목만 유지하도록 선택합니다.
-
다음 항목 선택 Choose for me 중복 제거 모드를 통해 식별된 중복 항목의 경우 저장된 레코드가 임의로 선택되도록 한 다음 Finish.
워크플로우를 실행할 때 중복으로 식별된 모든 수신자가 결과(및 게재)에서 제외되고 중복 목록에 추가됩니다. 중복을 다시 식별하지 않고 이 목록을 다시 사용할 수 있습니다.
필드를 단일 데이터 레코드로 병합 merging-fields-into-single-record
다음 Merge 기능을 사용하면 중복 제거에 대한 규칙 세트를 구성하여 필드 또는 필드 그룹을 정의하여 단일 결과 데이터 레코드로 병합할 수 있습니다.
예를 들어 중복 레코드 집합이 있는 경우 가장 오래된 전화 번호나 가장 최근 이름을 유지하도록 선택할 수 있습니다.
이 기능을 활용하는 사용 사례는에서 사용할 수 있습니다. 이 섹션.
이렇게 하려면 다음 단계를 수행합니다.
-
다음에서 Deduplication method 선택 단계에서 Advanced Parameters 링크를 클릭합니다.
-
다음 항목 선택 Merge records 옵션을 사용하여 기능을 활성화할 수 있습니다.
각 병합 조건에서 여러 데이터 필드를 그룹화하려면 Use several record merging criteria 옵션을 선택합니다.
-
기능을 활성화한 후 Merge 탭이 다음에 추가됩니다. Deduplication 활동. 병합할 필드 그룹과 관련 규칙을 정의할 수 있습니다.
자세한 내용은에서 사용할 수 있는 전용 사용 사례를 참조하십시오. 이 섹션.
입력 매개 변수 input-parameters
- tableName
- 스키마
각 인바운드 이벤트는 이러한 매개 변수로 정의된 대상을 지정해야 합니다.
출력 매개 변수 output-parameters
- tableName
- 스키마
- recCount
이 세 가지 값 세트는 중복 제거의 결과 타겟을 식별합니다. tableName 는 대상 식별자를 저장하는 테이블의 이름입니다. schema 모집단의 스키마(일반적으로 nms:recipient)이며, recCount 는 테이블에 있는 요소의 수입니다.
보체와 관련된 전환은 동일한 매개 변수를 갖는다.