Show Menu
ARGOMENTI×

Deduplication

Descrizione

L’attività Deduplication ti consente di eliminare i duplicati nei risultati delle attività in entrata.

Contesto di utilizzo

L’attività Deduplication viene generalmente utilizzata dopo attività di targeting o dopo l’importazione di un file e prima di attività che consentono l’utilizzo di dati oggetto di targeting.
Durante la deduplicazione, le transizioni in entrata vengono elaborate separatamente. Ad esempio, se il profilo “A” è presente nel risultato della query 1 e anche nel risultato della query 2, non verrà deduplicato.
È consigliabile pertanto che una deduplicazione abbia una sola transizione in entrata. A questo scopo, puoi combinare le diverse query utilizzando attività che corrispondono alle tue esigenze di targeting, come un’attività di unione, un’attività di intersezione, ecc. Ad esempio:
Argomenti correlati

Configurazione

Per configurare un’attività di deduplicazione, devi immettere un’etichetta, il metodo e i criteri di deduplicazione, nonché le opzioni relative al risultato.
  1. Trascina e rilascia un’attività Deduplication nel flusso di lavoro.
  2. Seleziona l’attività, quindi aprila utilizzando il pulsante delle azioni rapide visualizzate.
  3. Seleziona il Resource type su cui eseguire la deduplicazione:
    • Database resource se la deduplicazione viene eseguita su dati già presenti nel database. Seleziona la Filtering dimension e la Targeting dimension , a seconda dei dati da deduplicare. Per impostazione predefinita, la deduplicazione viene eseguita sui profili .
    • Temporary resource se la deduplicazione viene eseguita sui dati temporanei del flusso di lavoro: seleziona il Targeted set che contiene i dati da deduplicare. Questo caso di utilizzo può essere rilevato dopo l’importazione di un file o se i dati nel database sono stati arricchiti (ad esempio con un codice di segmento).
  4. Seleziona Number of unique records to keep . Il valore predefinito per questo campo è 1. Il valore 0 ti consente di conservare tutti i duplicati.
    Ad esempio, se i record A e B sono considerati duplicati del record Y e il record C è considerato un duplicato del record Z:
    • Se il valore del campo è 1: vengono conservati solo i record Y e Z.
    • Se il valore del campo è 0: vengono conservati tutti i record.
    • Se il valore del campo è 2: vengono conservati i record C e Z e due record tra A, B e Y, per caso o a seconda del metodo di deduplicazione selezionato successivamente.
  5. Definisci i criteri di Duplicate identification aggiungendo condizioni nell’elenco fornito. Specifica i campi e/o le espressioni per i quali i valori identici consentono l’identificazione dei duplicati: indirizzo e-mail, nome, cognome, ecc. L’ordine delle condizioni ti consente di specificare quali elaborare per prime.
  6. Nell’elenco a discesa, seleziona il Deduplication method da utilizzare:
    • Choose for me : seleziona in modo casuale il record da escludere dai duplicati.
    • Following a list of values : ti consente di definire un valore di priorità per uno o più campi. Per definire i valori, seleziona un campo o crea un’espressione, quindi aggiungi i valori nella tabella appropriata. Per definire un nuovo campo, fai clic sul pulsante Add situato sopra l’elenco dei valori.
    • Non-empty value : questo ti consente di conservare i record per i quali il valore dell’espressione selezionata non è vuoto come priorità.
    • Using an expression : questo ti consente di conservare i record in cui il valore dell’espressione immessa è il minore o il maggiore.
  7. Se necessario, gestisci le Transizioni dell’attività per accedere alle opzioni avanzate per la popolazione in uscita.
  8. Conferma la configurazione dell’attività e salva il flusso di lavoro.