Show Menu
ARGOMENTI×

Deduplicazione

Deduplicazione elimina i duplicati dai risultati delle attività in entrata. È possibile eseguire la deduplicazione sull'indirizzo e-mail, sul numero di telefono o su un altro campo.

Best practice

Durante la deduplicazione, i flussi in entrata vengono elaborati separatamente. Se, ad esempio, il destinatario A si trova nel risultato della query 1 e nel risultato della query 2, non verrà deduplicato.
Questo problema deve essere affrontato come segue:
  • Crea un'attività dell'Unione per unificare ogni flusso in entrata.
  • Create un'attività di deduplicazione dopo l'attività dell'Unione .

Configurazione

Per configurare una deduplicazione, immettete l’etichetta, il metodo e i criteri di deduplicazione, nonché le opzioni relative al risultato.
Fate clic sul Edit configuration... collegamento per definire la modalità di deduplicazione.
  1. Selezione destinazione
    Selezionare il tipo di target per questa attività (per impostazione predefinita, la deduplicazione riguarda i destinatari) e il criterio da utilizzare, ovvero il campo per il quale valori identici consentono di identificare duplicati: indirizzo e-mail, numero di cellulare o di telefono, numero di fax o indirizzo di posta diretta.
    Se si utilizzano dati esterni come input, ad esempio da un file esterno, assicurarsi di selezionare l' Temporary schema opzione. Nel passaggio successivo, l’ Other opzione consente di selezionare il criterio o i criteri da utilizzare:
  2. Metodi di deduplicazione
    Dall’elenco a discesa, selezionate il metodo di deduplicazione da utilizzare e immettete il numero di duplicati da conservare.
    Sono disponibili i seguenti metodi:
    • Choose for me : seleziona in modo casuale il record da escludere dai duplicati.
    • Following a list of values : consente di definire un valore di priorità per uno o più campi. Per definire i valori, selezionare un campo o creare un'espressione, quindi aggiungere i valori nella tabella appropriata. Per definire un nuovo campo, fare clic sul Add pulsante situato sopra l'elenco dei valori.
    • Non-empty value : consente di conservare i record per i quali il valore dell'espressione selezionata non è vuoto come priorità.
    • Using an expression : consente di conservare i record con il valore più basso (o più alto) dell'espressione data.
      Fare clic Finish per approvare il metodo di deduplicazione selezionato.
    La sezione centrale della finestra riepiloga la configurazione definita.
    Nella sezione inferiore della finestra dell'editor attività, potete modificare l'etichetta per la transizione in uscita dell'oggetto grafico e immettere un codice di segmento che verrà associato al risultato dell'attività. Questo codice può essere utilizzato successivamente come criterio di targeting.
    Selezionare l' Generate complement opzione se si desidera sfruttare la popolazione rimanente. Il complemento è costituito da tutti i duplicati. All'attività verrà quindi aggiunta un'ulteriore transizione, come segue:

Esempio: Identificare i duplicati prima della consegna

Nell'esempio seguente, la deduplicazione riguarda l'unione di tre query.
Lo scopo del flusso di lavoro è definire la destinazione per la consegna escludendo i duplicati per evitare di inviarla più volte allo stesso destinatario.
I duplicati identificati saranno inoltre integrati in un elenco dedicato di duplicati, che potrà essere riutilizzato se necessario.
  1. Aggiungete e collegate le varie attività necessarie per il funzionamento del flusso di lavoro, come mostrato sopra.
    L'attività dell'unione viene utilizzata qui per "unificare" le tre query in un'unica transizione. Di conseguenza, la deduplicazione non funziona per ogni query singolarmente ma per l’intera query. Per ulteriori informazioni su questo argomento, consulta Best practice .
  2. Aprite l'attività di deduplicazione, quindi fate clic sul Edit configuration... collegamento per definire la modalità di deduplicazione.
  3. Nella nuova finestra, selezionare Database schema .
  4. Selezionate Destinatari come dimensioni di targeting e filtro.
  5. Selezionate il campo ID per i Email duplicati, per inviare la consegna una sola volta a ogni indirizzo e-mail, quindi fate clic su Next .
    Se desiderate basare gli ID duplicati su un campo specifico, selezionate Other per accedere all'elenco dei campi disponibili.
  6. Scegliete di mantenere una sola voce quando lo stesso indirizzo e-mail è identificato per più destinatari.
  7. Selezionare la modalità di Choose for me deduplicazione in modo che i record salvati in caso di duplicati identificati vengano scelti in modo casuale, quindi fare clic Finish .
Durante l'esecuzione del flusso di lavoro, tutti i destinatari identificati come duplicati vengono esclusi dal risultato (e quindi dalla consegna) e aggiunti all'elenco dei duplicati. Questo elenco può essere utilizzato di nuovo anziché dover identificare nuovamente i duplicati.

Parametri di input

  • tableName
  • schema
Ogni evento in ingresso deve specificare una destinazione definita da questi parametri.

Parametri di output

  • tableName
  • schema
  • recCount
Questo insieme di tre valori identifica la destinazione risultante dalla deduplicazione. tableName è il nome della tabella che salva gli identificatori di destinazione, schema è lo schema della popolazione (in genere nms:destinatario) ed recCount è il numero di elementi nella tabella.
La transizione associata al complemento ha gli stessi parametri.