Show Menu
ARGOMENTI×

Deduplicazione

Descrizione

L' Deduplication attività consente di eliminare duplicati nei risultati delle attività in entrata.

Contesto di utilizzo

L' Deduplication attività viene generalmente utilizzata dopo le attività di targeting o dopo l'importazione di un file e prima di attività che consentono l'uso di dati con targeting.
Durante la deduplicazione, le transizioni in entrata vengono elaborate separatamente. Ad esempio, se il profilo 'A' è presente nel risultato della query 1 e anche nel risultato della query 2, non verrà deduplicato.
Si consiglia pertanto che una deduplicazione abbia una sola transizione in entrata. A questo scopo, potete combinare le vostre diverse query utilizzando attività che corrispondono alle vostre esigenze di targeting, come un'attività dell'unione, un'attività di intersezione, ecc. Ad esempio:
Argomenti correlati

Configurazione

Per configurare un'attività di deduplicazione, è necessario immettere un'etichetta, il metodo e i criteri di deduplicazione, nonché le opzioni relative al risultato.
  1. Trascinate e rilasciate un' Deduplication attività nel flusso di lavoro.
  2. Selezionate l'attività, quindi apritela utilizzando il pulsante delle azioni rapide visualizzate.
  3. Selezionare Resource type su cui eseguire la deduplicazione:
    • Database resource se la deduplicazione viene eseguita su dati già presenti nel database. Selezionate il Filtering dimension e il Targeting dimension , a seconda dei dati da deduplicare. Per impostazione predefinita, la deduplicazione viene eseguita sui profili .
    • Temporary resource se la deduplicazione viene eseguita sui dati temporanei del flusso di lavoro: selezionare il Targeted set contenitore dei dati da deduplicare. Questo caso di utilizzo può essere rilevato dopo l’importazione di un file o se i dati nel database sono stati arricchiti (ad esempio con un codice del segmento).
  4. Selezionare il Number of unique records to keep . Il valore predefinito per questo campo è 1. Il valore 0 consente di conservare tutti i duplicati.
    Ad esempio, se i record A e B sono considerati duplicati del record Y e il record C è considerato un duplicato del record Z:
    • Se il valore del campo è 1: vengono conservati solo i record Y e Z.
    • Se il valore del campo è 0: tutti i documenti sono conservati.
    • Se il valore del campo è 2: i record C e Z sono conservati e due record da A, B e Y sono conservati, per caso o a seconda del metodo di deduplicazione selezionato successivamente.
  5. Definite i Duplicate identification criteri aggiungendo le condizioni nell'elenco fornito. Specificare i campi e/o le espressioni per i quali i valori identici consentono l'identificazione dei duplicati: indirizzo e-mail, nome, cognome, ecc. L'ordine delle condizioni consente di specificare quali elaborare per primi.
  6. Nell'elenco a discesa, selezionate l'opzione Deduplication method da utilizzare:
    • Choose for me : seleziona in modo casuale il record da escludere dai duplicati.
    • Following a list of values : consente di definire un valore di priorità per uno o più campi. Per definire i valori, selezionare un campo o creare un'espressione, quindi aggiungere i valori nella tabella appropriata. Per definire un nuovo campo, fare clic sul Add pulsante situato sopra l'elenco dei valori.
    • Non-empty value : consente di conservare i record per i quali il valore dell'espressione selezionata non è vuoto come priorità.
    • Using an expression : questo consente di conservare i record in cui il valore dell'espressione immessa è il più piccolo o il più grande.
  7. Se necessario, gestite le Transizioni dell'attività per accedere alle opzioni avanzate per la popolazione in uscita.
  8. Confermate la configurazione dell'attività e salvate il flusso di lavoro.