Show Menu
TÓPICOS×

Editando o arquivo de configuração de transformação

Etapas para editar o arquivo Transformation.cfg para um perfil de conjunto de dados.
  1. Ao trabalhar em seu perfil de conjunto de dados, abra o Profile Manager e clique Dataset para mostrar seu conteúdo.
    Para obter informações sobre como abrir e trabalhar com o Profile Manager, consulte o Guia do usuário da Análise de big data.
    Um subdiretório Transformation pode existir no diretório Dataset. Esse subdiretório contém os Transformation Dataset Include arquivos que foram criados para um ou mais perfis herdados. Para obter informações sobre Transformation Dataset Include arquivos, consulte Arquivo de inclusão de conjuntos de dados .
  2. Clique com o botão direito do mouse na marca de seleção ao lado de Transformation.cfg e clique em Make Local . Uma marca de seleção para este arquivo é exibida na User coluna.
  3. Clique com o botão direito do mouse na marca de seleção recém-criada e clique em Open > in Workstation . A Transformation.cfg janela é exibida.
    Você também pode abrir o Transformation.cfg arquivo a partir de um Transformation Dependency Map. Para obter informações sobre transformation dependency maps, consulte Ferramentas de configuração de conjuntos de dados.
  4. Edite os parâmetros no arquivo de configuração usando a tabela a seguir como guia.
    Ao editar o Transformation.cfg arquivo em uma janela de análise de big data, você pode usar teclas de atalho para recursos básicos de edição, incluindo recortar (Ctrl+x ), copiar (Ctrl+c), colar (Ctrl+v ), desfazer (Ctrl+z ), refazer (Ctrl+Shift+z ), selecionar a seção (clique+arrastar) e selecionar tudo (Ctrl+a ). Além disso, você pode usar os atalhos para copiar e colar o texto de um arquivo de configuração ( .cfg) para outro.
    Os Transformation Dataset Include arquivos de um perfil herdado contêm um subconjunto dos parâmetros descritos na tabela a seguir, bem como alguns parâmetros adicionais. Para obter informações sobre Transformation Dataset Include arquivos, consulte Incluir arquivos do conjunto de dados
    Parâmetro Descrição
    Hora de término
    Opcional. Filtre os dados para incluir entradas de log com carimbos de data e hora até, mas não incluindo, desta vez. A Adobe recomenda usar um dos seguintes formatos para o tempo:
    • 1 de janeiro de 2013 HH:MM:SS EDT
    • Jan 1 2013 HH:MM:SS GMT
    Por exemplo, especificar "29 de julho de 2013 00:00:00 EDT" como a Hora de término inclui dados até 28 de julho de 2013, às 11:59:59 EDT.
    Você deve especificar um fuso horário. O fuso horário não assumirá GMT como padrão se não for especificado. Para obter uma lista de abreviações de fuso horário suportadas pelo servidor da análise de big data, consulte Códigos de fuso horário .
    Observação: Se você especificar um valor para Hora de término, um parâmetro chamado Hora de término será definido e aplicado durante toda a fase de transformação da construção do conjunto de dados. Para obter informações sobre parâmetros, consulte Definindo Parâmetros em Arquivos de Inclusão de Conjunto de Dados .
    Dimensões estendidas Opcional. A Adobe recomenda definir dimensões estendidas em um ou mais arquivos de inclusão de conjuntos de dados de transformação. Para obter informações, consulte Transformation Dataset Include Files (Incluir arquivos do conjunto de dados de transformação) .
    Limite de hash
    Opcional. Um fator de amostragem para a subamostragem aleatória de linhas. Se definido como um número n, somente uma de cada n IDs de rastreamento informa o conjunto de dados, reduzindo o número total de linhas no conjunto de dados por um fator n. Para criar um conjunto de dados que exija 100% de precisão (ou seja, para incluir todas as linhas), você definiria o Limite de hash como 1.
    Se o Limite de Hash for especificado nos arquivos Log Processing.cfg e Transformation.cfg , ele não será aplicado em sequência; aplica-se o máximo dos valores definidos em qualquer arquivo de configuração.
    Condição de entrada do registro Opcional. Define as regras pelas quais a saída de entradas de log do processamento de log é considerada para inclusão no perfil do conjunto de dados. Consulte Condição de entrada do registro .
    Nova condição do visitante Opcional. Para uso com dados da Web. Define as regras pelas quais os visitantes são considerados para inclusão nos dados. A Nova condição de visitante define a primeira entrada de registro para um visitante (ordenada por hora) que deve ser usada no conjunto de dados. Todas as entradas de log subsequentes para esse visitante são incluídas no conjunto de dados, independentemente de atenderem a essa condição. Consulte Nova condição de visitante .
    Reprocessar
    Opcional. Qualquer caractere ou combinação de caracteres pode ser inserida aqui. Alterar esse parâmetro e salvar o arquivo inicia a retransformação de dados.
    Para obter informações sobre como reprocessar seus dados, consulte Reprocessamento e Retransformação .
    Verificação de esquema Verdadeiro ou falso. Se verdadeiro, o servidor de análise de big data identifica problemas de corrupção do conjunto de dados e registra informações sobre os problemas nos arquivos de log no diretório Trace do servidor de análise de big data. O valor padrão é true. A Adobe recomenda deixar esse parâmetro definido como true a qualquer momento.
    Estágios
    Opcional. Os nomes dos estágios de processamento que podem ser usados em Transformation Dataset Incluem arquivos. Os estágios de processamento fornecem uma maneira de ordenar as transformações definidas nos arquivos Transformation Dataset Include. Esse parâmetro é muito útil se você tiver definido uma ou mais transformações em vários arquivos de Inclusão de Conjunto de Dados de Transformação e desejar que transformações específicas sejam executadas em pontos específicos durante a transformação.
    A ordem em que você lista os estágios aqui determina a ordem em que as transformações nos arquivos Transformation Dataset Include são executadas durante a transformação. O pré-processamento e o pós-processamento são fases integradas; O pré-processamento é sempre o primeiro estágio, e o pós-processamento é sempre o último estágio. Por padrão, há uma etapa nomeada chamada Padrão .
    Para adicionar uma nova etapa de processamento
    • Na janela Transformation.cfg , clique com o botão direito do mouse em Estágios e clique em Adicionar novo > Estágio .
    • Insira um nome para o novo estágio.
    Para excluir um estágio de processamento existente
    • Clique com o botão direito do mouse no número correspondente ao estágio que deseja excluir e clique em Remover < #stage_number > .
    Observação: Quando você especifica um Palco em um Conjunto de Dados de Transformação Incluir arquivos, o nome do palco deve corresponder exatamente ao nome inserido aqui. Para obter mais informações sobre o conjunto de dados incluir arquivos, consulte Conjunto de dados Incluir arquivos .
    Hora inicial
    Opcional. Filtre os dados para incluir entradas de log com carimbos de data e hora nesse momento ou depois dele. A Adobe recomenda usar um dos seguintes formatos para o tempo:
    • 1 de janeiro de 2013 HH:MM:SS EDT
    • Jan 1 2013 HH:MM:SS GMT
    Por exemplo, especificar 29 de julho de 2013 00:00:00 EDT como a Hora de início inclui dados que começam a partir de 29 de julho de 2013, às 12:00:00 AM EDT.
    Você deve especificar um fuso horário. O fuso horário não assumirá GMT como padrão se não for especificado. Para obter uma lista de abreviações de fuso horário suportadas pelo servidor da análise de big data, consulte Códigos de fuso horário .
    Observação: Se você especificar um valor para a Hora de início, um parâmetro chamado Hora de início será definido e aplicado em toda a fase de transformação da construção do conjunto de dados. Para obter informações sobre parâmetros, consulte Definindo Parâmetros em Arquivos de Inclusão de Conjunto de Dados .
    Transformações Opcional. A Adobe recomenda definir transformações para a fase de transformação da construção do conjunto de dados em um ou mais arquivos de Inclusão do conjunto de dados de transformação . Para obter informações, consulte Transformation Dataset Include Files (Incluir arquivos do conjunto de dados de transformação) .
    Fuso Horário
    Fuso horário do perfil do conjunto de dados. Os fusos horários são usados para conversões de tempo e para criar dimensões de tempo. Consulte Fusos horários .
    Observação: Quando definido no arquivo Log Processing.cfg , o parâmetro Fuso horário é usado apenas para conversões de tempo.
  5. Clique com o botão direito do mouse (modified) na parte superior da janela e clique em Save .
  6. Na Profile Manager, clique com o botão direito do mouse na marca de seleção para Transformation.cfgna User coluna, em seguida, clique em Save to > * dataset profile name para que as alterações feitas localmente entrem em vigor. A retransformação dos dados começa após a sincronização do perfil do conjunto de dados.
    Não salve o arquivo de configuração modificado em nenhum dos perfis internos fornecidos pela Adobe, pois suas alterações são substituídas quando você instala atualizações nesses perfis.
    Para obter informações sobre como reprocessar ou retransformar seus dados, consulte Reprocessamento e Retransformação .