Show Menu
TÓPICOS×

Grupos do decodificador de arquivos de texto

O processamento de arquivos de log como fontes de log requer a definição de um decodificador no arquivo Incluir do Conjunto de Dados de Processamento de Log para extrair campos de dados das entradas de log.
A definição de grupos do decodificador de arquivos de texto para fontes de log requer conhecimento da estrutura e do conteúdo do arquivo de log, dos dados a serem extraídos e dos campos nos quais esses dados são armazenados. Esta seção fornece descrições básicas dos parâmetros que você pode especificar para decodificadores, mas a maneira como você usa qualquer decodificador depende do arquivo de log que contém os dados de origem.
Para obter informações sobre os requisitos de formato para fontes de log de arquivos, consulte Arquivos de Log . Para obter ajuda com a definição de decodificadores de arquivos de texto, entre em contato com a Adobe.
Um grupo de decodificador de arquivos de texto pode incluir:

Decodificadores de expressão regular

Um decodificador de expressão regular identifica padrões complexos de sequência dentro das entradas de log em um arquivo de log e extrai esses padrões como campos de dados. Para cada decodificador, o número de campos deve ser igual ao número de subpadrões de captura na expressão regular. A parte da linha que corresponde ao subpadrão de captura n é atribuída ao enésimo campo dessa linha.
Para adicionar um decodificador de expressão regular a um grupo decodificador de arquivos de texto
  1. Abra o Log Processing Dataset Include arquivo conforme descrito em Edição de conjuntos de dados existentes Incluir arquivos e adicione um grupo de decodificador de arquivos de texto. Consulte a entrada da tabela Grupos c-log-proc-dataset-inc-files.translate.html#concept-999475a22519432e98844622ca95b6ab decodificadores.
  2. Clique com o botão direito do mouse Decoders no grupo de decodificadores recém-criado e clique em Add new > Regular Expression .
  3. Especifique as seguintes informações:
    • Campos: Lista dos campos no arquivo de log. Se algum dos campos definidos aqui forem transmitidos para a fase de transformação da construção do conjunto de dados, esses campos deverão ser listados no parâmetro Campos de um dos Log Processing Dataset Include arquivos do conjunto de dados. Os nomes de campos personalizados devem começar com "x-".
    • Nome: Identificador opcional para o decodificador.
    • Expressão regular: Usado para extrair os campos desejados de cada linha do arquivo.
  4. Repita as etapas 4 e 5 para qualquer outro decodificador que você deseja adicionar ao grupo.
  5. Para salvar o Log Processing Dataset Include arquivo, clique com o botão direito do mouse (modified) na parte superior da janela e clique em Save .
  6. Para que as alterações feitas localmente entrem em vigor, no Profile Manager, clique com o botão direito do mouse na marca de seleção do arquivo na User coluna. Clique em Save to > < profile name > , onde nome do perfil é o nome do perfil do conjunto de dados ou o perfil herdado ao qual o conjunto de dados inclui o arquivo.
Não salve o arquivo de configuração modificado em nenhum dos perfis internos fornecidos pela Adobe, pois suas alterações são substituídas quando você instala atualizações nesses perfis.
Um determinado arquivo de log pode ter vários decodificadores de expressão regular. A ordem em que você define os decodificadores é importante: o primeiro decodificador a corresponder a uma linha no arquivo de log é o usado para decodificar essa linha.
Este exemplo ilustra o uso de um decodificador de expressão regular para extrair campos de dados de um arquivo de texto delimitado por tabulação. Você pode obter o mesmo resultado definindo um decodificador delimitado com um delimitador de tabulação.
Para obter mais informações sobre decodificadores de expressões regulares, incluindo terminologia e sintaxe, consulte Expressões regulares .

Decodificadores Delimitados

Um decodificador delimitado decodifica um arquivo de log cujos campos são delimitados por um único caractere. O número de campos deve corresponder ao número de colunas no arquivo delimitado; no entanto, nem todos os campos precisam ser nomeados. Se um campo ficar em branco, a coluna ainda será necessária no arquivo de log, mas o decodificador a ignorará.
Para adicionar um decodificador delimitado a um grupo de decodificador de arquivos de texto
  1. Abra o Log Processing Dataset Include arquivo conforme descrito em Edição de conjuntos de dados existentes Incluir arquivos e adicione um grupo de decodificador de arquivos de texto. Consulte a entrada da tabela Grupos c-log-proc-dataset-inc-files.translate.html#concept-999475a22519432e98844622ca95b6ab decodificadores.
  2. Clique com o botão direito do mouse Decoders no grupo de decodificadores recém-criado e clique em Add new > Delimited .
  3. Especifique as seguintes informações:
    • Campos: Lista dos campos no arquivo de log. Se algum dos campos definidos aqui forem transmitidos para a fase de transformação da construção do conjunto de dados, esses campos deverão ser listados no parâmetro Campos de um dos Log Processing Dataset Include arquivos do conjunto de dados. Os nomes de campos personalizados devem começar com "x-".
    • Delimitador: Caractere usado para separar campos no arquivo de saída.
  4. Repita as etapas 4 e 5 para qualquer outro decodificador que você deseja adicionar ao grupo.
  5. Para salvar o Log Processing Dataset Include arquivo, clique com o botão direito do mouse (modified) na parte superior da janela e clique em Save .
  6. Para que as alterações feitas localmente entrem em vigor, no Profile Manager, clique com o botão direito do mouse na marca de seleção do arquivo na User coluna, em seguida, clique em Save to > < profile name > , onde nome do perfil é o nome do perfil do conjunto de dados ou o perfil herdado ao qual o conjunto de dados inclui o arquivo.
Não salve o arquivo de configuração modificado em nenhum dos perfis internos fornecidos pela Adobe, pois suas alterações são substituídas quando você instala atualizações nesses perfis.
Este exemplo ilustra o uso de um decodificador delimitado para extrair campos de dados de um arquivo de texto delimitado por vírgulas contendo dados sobre filmes.