Show Menu
TÓPICOS×

Editando o arquivo de configuração de processamento de log

Etapas para editar o arquivo Log Processing.cfg para um perfil de conjunto de dados.
  1. Ao trabalhar em seu perfil de conjunto de dados, abra o Profile Manager e clique Dataset para mostrar seu conteúdo.
    Para obter informações sobre como abrir e trabalhar com o Profile Manager, consulte o Guia do usuário da Análise de big data.
    Pode existir um subdiretório Log Processing no diretório Dataset. Esse subdiretório contém os Log Processing Dataset Include arquivos que foram criados para um ou mais perfis herdados. Consulte Incluir arquivos do conjunto de dados.
  2. Clique com o botão direito do mouse na marca de seleção ao lado de Log Processing.cfg e clique em Make Local . Uma marca de seleção para este arquivo é exibida na User coluna.
  3. Clique com o botão direito do mouse na marca de seleção recém-criada e clique em Open > in Workstation . A Log Processing.cfg janela é exibida.
    Você também pode abrir o Log Processing.cfg arquivo a partir de um Transformation Dependency Map. Para obter informações sobre mapas de dependência de transformação, consulte Ferramentas de Configuração de Conjunto de Dados.
  4. Edite os parâmetros no arquivo de configuração usando a tabela a seguir como guia.
    Ao editar o Log Processing.cfg arquivo em uma janela de análise de big data, você pode usar teclas de atalho para recursos básicos de edição, incluindo recortar ( Ctrl+x ), copiar ( Ctrl+c), colar ( Ctrl+v ), desfazer ( Ctrl+z ), refazer ( Ctrl+Shift+z ), selecionar seção (clique+arrastar) e selecionar tudo ( Ctrl+a ). Você também pode usar os atalhos para copiar e colar o texto de um arquivo de configuração ( .cfg) para outro.
    Um Log Processing Dataset Include arquivo para um perfil herdado contém um subconjunto dos parâmetros descritos na tabela a seguir, bem como alguns parâmetros adicionais. Consulte Incluir arquivos do conjunto de dados.
    Parâmetro Descrição
    Fontes de registro As fontes de dados. Consulte Origens de registro .
    Hora de término
    Opcional. Filtre os dados para incluir entradas de log com carimbos de data e hora até, mas não incluindo, desta vez. A Adobe recomenda usar um dos seguintes formatos para o tempo:
    • 1 de janeiro de 2013 HH:MM:SS EDT
    • Jan 1 2013 HH:MM:SS GMT
    Por exemplo, especificar 29 de julho de 2013 00:00:00 EDT como a Hora de término inclui dados até 28 de julho de 2013, às 11:59:59 EDT. Consulte Filtros de dados .
    Você deve especificar um fuso horário. O fuso horário não assumirá GMT como padrão se não for especificado. Para obter uma lista de abreviações de fuso horário suportadas pelo servidor da análise de big data, consulte Códigos de fuso horário .
    Observação: O parâmetro Use Start/End Times para fontes Sensor, arquivo de log e XML está relacionado a esse parâmetro. Consulte as seções de Fontes de registro que discutem esses tipos de origem.
    Campos Opcional. A Adobe recomenda definir Campos em um ou mais Arquivos de Inclusão de Conjunto de Dados de Processamento de Log . Consulte Log Processing Dataset Incluir Arquivos .
    Número Máximo de Bytes de Chave do Grupo
    Quantidade máxima de dados de eventos que o Servidor pode processar para uma única ID de rastreamento. Os dados que excedem esse limite são filtrados do processo de construção do conjunto de dados. Esse valor deve ser definido como 2e6 quando a divisão da chave estiver ativa e 1e6 quando a divisão da chave não estiver ativa. Consulte Divisão de chaves.
    Observação: Não altere esse valor sem consultar a Adobe.
    Limite de hash
    Opcional. Um fator de amostragem para a subamostragem aleatória de linhas. Se definido como um número n, somente uma de cada n IDs de rastreamento informa o conjunto de dados, reduzindo o número total de linhas no conjunto de dados por um fator n.
    Para criar um conjunto de dados que exija 100% de precisão (ou seja, para incluir todas as linhas), você definiria o Limite de hash como 1.
    Valores:
    Limite de hash = 1 (100% dos dados incluindo todas as linhas).
    Limite de hash = 2 (1/2 de dados e inclui metade das linhas).
    Limite de hash = 3 (1/3 de dados e inclui uma de três linhas, mas arredonda para 34% na Conclusão da consulta)
    Limite de hash = 4 (1/4 dos dados e inclui uma em cada quatro linhas.)
    Observação: Usar um Limite de Hash = 8 fornece 1/8 dos dados, que são 12,5%. No entanto, o valor de Conclusão de consulta é arredondado para 13% para esse valor. Exemplos adicionais incluem um Limite de Hash = 6 que resulta em 17% de resolução de consulta. Um Limite de Hash = 13 resulta em 8% de resolução de consulta.
    Se o Limite de Hash for especificado nos arquivos Log Processing.cfg e Transformation.cfg , ele não será aplicado em sequência; o valor máximo definido em qualquer arquivo de configuração se aplica. Consulte Filtros de dados .
    Condição de entrada do registro Opcional. Define as regras pelas quais as entradas de log são consideradas para inclusão no conjunto de dados. Consulte Condição de entrada do registro .
    Reprocessar
    Opcional. Qualquer caractere ou combinação de caracteres pode ser inserida aqui. Alterar esse parâmetro e salvar o arquivo na máquina do servidor do análise de big data inicia o reprocessamento de dados.
    Dividir espaço do compartimento de chaves
    Parâmetro envolvido na divisão da chave. Seu valor deve ser 6e6 quando a divisão da chave estiver ativa. Consulte Divisão de chaves.
    Observação: Não altere esse valor sem consultar a Adobe.
    Dividir bytes de chave
    Parâmetro envolvido na divisão da chave. Seu valor deve ser 1e6 quando a divisão da chave estiver ativa e 0 quando a divisão da chave não estiver ativa. Consulte Divisão de chaves.
    Observação: Não altere esse valor sem consultar a Adobe.
    Proporção de espaço de chave dividida
    Parâmetro envolvido na divisão da chave. Seu valor deve ser 10 quando a divisão da chave estiver ativa. Consulte Divisão de chaves.
    Observação: Não altere esse valor sem consultar a Adobe.
    Estágios
    Opcional. Os nomes dos estágios de processamento que podem ser usados nos arquivos de Inclusão do Conjunto de Dados de Processamento de Log . As etapas de processamento fornecem uma maneira de solicitar as transformações definidas nos arquivos Incluir conjuntos de dados de processamento de log. Esse parâmetro é muito útil se você tiver definido uma ou mais transformações em vários arquivos de Inclusão do Conjunto de Dados de Processamento de Log e desejar que transformações específicas sejam executadas em pontos específicos durante o processamento de log.
    A ordem em que você lista os estágios aqui determina a ordem em que as transformações nos arquivos Incluir do Conjunto de Dados de Processamento de Log são executadas durante o processamento de log. O pré-processamento e o pós-processamento são estágios integrados. O pré-processamento é sempre o primeiro estágio, e o pós-processamento é sempre o último estágio. Por padrão, há uma etapa nomeada chamada Padrão.
    Para adicionar uma nova etapa de processamento
    • Na janela Log Processing.cfg , clique com o botão direito do mouse em Estágios e clique em Adicionar novo > Estágio .
    • Insira um nome para o novo estágio.
    Para excluir um estágio de processamento existente
    • Clique com o botão direito do mouse no número correspondente ao estágio que deseja excluir e clique em Remover < #stage_number > .
    Observação: Quando você especifica um Palco em um Conjunto de Dados de Processamento de Log Incluir arquivos, o nome do estágio deve corresponder exatamente ao nome inserido aqui. Consulte Arquivo de inclusão de conjunto de dados .
    Hora inicial
    Opcional. Filtre os dados para incluir entradas de log com carimbos de data e hora nesse momento ou depois dele. A Adobe recomenda usar um dos seguintes formatos para o tempo:
    • 1 de janeiro de 2013 HH:MM:SS EDT
    • Jan 1 2013 HH:MM:SS GMT
    Por exemplo, especificar "29 de julho de 2013 00:00:00 EDT" como a Hora de início inclui dados que começam a partir de 29 de julho de 2013, às 12:00:00 AM EDT. Consulte Filtros de dados .
    Você deve especificar um fuso horário. O fuso horário não assumirá GMT como padrão se não for especificado. Para obter uma lista de abreviações de fuso horário suportadas pelo servidor da análise de big data, consulte Códigos de fuso horário .
    Observação: O parâmetro Use Start/End Times para fontes Sensor, arquivo de log e XML está relacionado a esse parâmetro. Consulte as seções de Fontes de registro que discutem esses tipos de origem.
    Fuso Horário
    Opcional. Fuso horário do servidor da análise de big data usado para conversões de tempo (como a conversão representada pelo campo x-local-timestring) durante o processamento de log.
    Observação: Você deve especificar o Fuso horário se desejar acessar o campo de tempo convertido durante a fase de processamento de log da construção do conjunto de dados. Caso contrário, o servidor da análise de big data registrará um erro nos logs de eventos.
    Transformações Opcional. A Adobe recomenda definir transformações para o processamento de log em um ou mais arquivos de Inclusão de conjuntos de dados de processamento de log. Consulte Log Processing Dataset Incluir Arquivos .
  5. Clique com o botão direito do mouse (modified) na parte superior da janela e clique em Save .
  6. Na Profile Manager, clique com o botão direito do mouse na marca de seleção para Log Processing.cfgna User coluna, em seguida, clique em Save to > < dataset profile name > para que as alterações feitas localmente tenham efeito. O reprocessamento dos dados começa após a sincronização do perfil do conjunto de dados.
    Não salve o arquivo de configuração modificado em nenhum dos perfis internos fornecidos pela Adobe, pois suas alterações são substituídas quando você instala atualizações nesses perfis.
    Para obter mais informações sobre como reprocessar seus dados, consulte Reprocessamento e Retransformação .