Show Menu
TÓPICOS×

Eliminação de duplicação

A desduplicação exclui duplicatas dos resultados das atividades de entrada. A desduplicação pode ser executada no endereço de e-mail, número de telefone ou outro campo.

Práticas recomendadas

Durante a desduplicação, os fluxos de entrada são processados separadamente. Se por exemplo, o recipient A for encontrado no resultado da query 1, bem como no resultado da query 2, eles não serão desduplicados.
Esse problema precisa ser resolvido da seguinte maneira:
  • Crie uma atividade Union para unificar cada fluxo de entrada.
  • Crie uma atividade Deduplication após a atividade Union .

Configuração

Para configurar uma desduplicação, insira o rótulo, o método e os critérios de desduplicação e as opções referentes ao resultado.
Clique no link Edit configuration... para definir o modo de desduplicação.
  1. Seleção do target
    Selecione o tipo de target para esta atividade (por padrão, desduplicação lidam com recipients) e o critério a ser usado, ou seja, o campo para o qual os valores idênticos permitem identificar duplicatas: endereço de e-mail, número de celular ou endereço de mala direta.
    Se os dados externos estiverem sendo usados como entrada, por exemplo, de um arquivo externo, selecione a opção Temporary schema . Na próxima etapa, a opção Other permite selecionar o critério ou os critérios a serem usados:
  2. Métodos de desduplicação
    Na lista suspensa, selecione o método de desduplicação a ser usado e insira o número de duplicatas a serem mantidas.
    Os métodos seguintes estão disponíveis:
    • Choose for me : seleciona aleatoriamente o registro a ser mantido fora das duplicatas.
    • Following a list of values : permite definir uma prioridade de valor para um ou mais campos. Para definir os valores, selecione um campo ou crie uma expressão e adicione o(s) valor(s) à tabela apropriada. Para definir um novo campo, clique no botão Add localizado acima da lista de valores.
    • Non-empty value : permite manter registros para os quais o valor da expressão selecionada não está vazio como uma prioridade.
    • Using an expression : permite manter registros com o valor mais baixo (ou mais alto) da expressão fornecida.
      Clique em Finish para aprovar o método de desduplicação selecionado.
    A seção intermediária da janela resume a configuração definida.
    Na seção inferior da janela do editor de atividades, é possível modificar o rótulo da transição de saída do objeto gráfico e inserir um código de segmento que será associado ao resultado da atividade. Esse código pode ser usado posteriormente como um critério de target.
    Marque a opção Generate complement se desejar explorar a população restante. O complemento consiste de todas as duplicatas. Uma transição adicional será adicionada à atividade, da seguinte maneira:

Exemplo: identificar as duplicatas antes de um delivery

No exemplo a seguir, a desduplicação lida com a união entre três queries.
O objetivo do workflow é definir o target de uma delivery excluindo duplicatas para evitar o envio para o mesmo recipient várias vezes.
As duplicatas identificadas também serão integradas em uma lista de duplicatas dedicada que podem ser reutilizadas se necessário.
  1. Adicione e vincule as várias atividades necessárias para que o workflow funcione conforme mostrado acima.
    A atividade Union é usada aqui para "unificar" as três queries em uma única transição. Assim, a desduplicação não funcionará para cada query individualmente, mas para toda a query. Para obter mais informações sobre este assunto, consulte Melhores práticas .
  2. Abra a atividade de desduplicação e clique no link Edit configuration... para definir o modo de desduplicação.
  3. Na nova janela, selecione Database schema .
  4. Selecione Recipients como dimensões de filtragem e direcionamento.
  5. Selecione o campo de ID para as duplicatas de Email a fim de enviar o delivery somente uma vez para cada endereço de email, depois clique em Next .
    Se desejar basear as IDs duplicadas em um campo específico, selecione Other para acessar a lista de campos disponíveis.
  6. Escolha manter apenas uma entrada quando o mesmo endereço de email for identificado para vários recipients.
  7. Selecione o modo de desduplicação Choose for me para que os registros salvos no caso de duplicatas identificadas sejam escolhidos aleatoriamente, depois clique em Finish .
Ao executar o workflow, todos os recipients identificados como duplicatas são excluídos do resultado (e, portanto, da delivery) e adicionada à lista de duplicatas. Essa lista pode ser usada novamente em vez de ter que reidentificar as duplicatas.

Parâmetros de entrada

  • tableName
  • schema
Cada evento de entrada deve especificar um target definido por esses parâmetros.

Parâmetros de output

  • tableName
  • schema
  • recCount
Esse conjunto de três valores identifica o target resultante da desduplicação. tableName é o nome da tabela que salva os identificadores de direcionamento, schema é o esquema da população (geralmente nms:recipient) e recCount é o número de elementos na tabela.
A transição associada ao complemento tem os mesmos parâmetros.