Show Menu
TÓPICOS×

Fontes de dados ODBC

O servidor de análise de big data (InsightServer64.exe) pode ler dados de eventos de qualquer banco de dados SQL (por exemplo, Oracle ou Microsoft SQL Server) que tenha um driver compatível com ODBC 3.0.
O suporte ODBC do servidor de análise de big data é semelhante ao suporte existente para carregar dados de Sensores ou de arquivos de log gerados por processos externos. No entanto, existem algumas considerações e limitações adicionais:
  • O suporte ODBC do servidor de análise de big data é compatível com os recursos de agrupamento. Os dados são distribuídos entre todos os servidores de processamento, e todo o processamento subsequente (incluindo processamento de consulta) se beneficia totalmente do agrupamento.
  • O suporte a ODBC depende de drivers ODBC de terceiros. Para que o suporte a ODBC funcione, esses drivers devem ser configurados na máquina em que o servidor de análise de big data é executado, usando ferramentas externas à plataforma da Adobe. As máquinas de análise de big data não exigem nenhuma configuração adicional.
  • A tabela ou exibição da qual os dados são carregados deve ter uma coluna de ID crescente. Para qualquer linha, o valor desta coluna (que pode ser uma coluna real na tabela ou qualquer expressão de coluna SQL) não deve diminuir à medida que novas linhas são inseridas no banco de dados. Se essa restrição for violada, os dados serão perdidos. Para obter o desempenho adequado, é necessário um índice nessa expressão de coluna ou coluna.
    É possível que várias linhas tenham o mesmo valor na Increasing ID coluna. Uma possibilidade é uma coluna com carimbo de data e hora com precisão inferior à perfeita.
  • O servidor da análise de big data não pode carregar colunas com dados longos (dados acima de um determinado comprimento, conforme determinado pelo aplicativo de banco de dados específico em uso).
  • A recuperação de dados de um banco de dados é mais lenta do que lê-los a partir de um arquivo de disco. Os conjuntos de dados que carregam dados de uma fonte ODBC levam muito mais tempo para serem processados (principalmente durante o reprocessamento) do que conjuntos de dados de tamanho equivalente cujos dados vêm de Sensores ou outros arquivos de disco.
Para obter informações sobre como reprocessar seus dados, consulte Reprocessamento e Retransformação .
Para configurar o Insight Server para ODBCevent data
A configuração do servidor de análise de big data para carregar dados de um banco de dados SQL exige que você execute as seguintes etapas primeiro, em ordem:
  1. Instale o software cliente do banco de dados apropriado, incluindo um driver ODBC, na máquina do servidor da análise de big data na qual o conjunto de dados é processado.
    Se você estiver carregando dados de eventos ODBC para processamento em um cluster de servidores de análise de big data, deverá instalar o software cliente de banco de dados em todos os servidores de processamento no cluster. Para obter informações sobre como especificar servidores de processamento em um cluster, consulte o Guia de Instalação e Administração de Produtos de Servidor.
  2. Configure uma fonte de dados usando o administrador da fonte de dados ODBC para Windows.
    É importante observar que o servidor de análise de big data (InsightServer64.exe) é executado como um serviço do Windows. Portanto, a Fonte de Dados normalmente deve ser configurada como um DSN de Sistema em vez de um DSN de Usuário para que o servidor de análise de big data possa usá-la. Você pode encontrar mais informações sobre essa etapa de configuração na documentação do software do banco de dados.
Depois de instalar o software cliente do banco de dados na máquina do servidor de análise de big data apropriada, você pode configurar o conjunto de dados para usar a fonte de dados ODBC editando os parâmetros apropriados no arquivo de Log Processing configuração para o perfil desejado.

Parâmetros

Para dados de bancos de dados que usam o padrão Open Database Connectivity (ODBC), os seguintes parâmetros estão disponíveis:
Parâmetro Descrição
Nome O identificador da fonte ODBC.
Nome da fonte de dados Um DSN, conforme fornecido por um administrador da máquina do servidor da análise de big data na qual o conjunto de dados é processado, que se refere ao banco de dados a partir do qual os dados devem ser carregados.
Senha do banco de dados A senha a ser usada na conexão com o banco de dados. Se uma senha tiver sido configurada para o DSN no Administrador da fonte de dados, ela poderá ficar em branco. Qualquer senha fornecida aqui substitui a senha configurada para o DSN no Administrador da fonte de dados.
ID de usuário do banco de dados A ID de usuário a ser usada ao conectar-se ao banco de dados. Se uma ID de usuário tiver sido configurada para o DSN no Administrador da fonte de dados, isso pode ficar em branco. Qualquer ID de usuário fornecida aqui substitui a ID de usuário configurada para o DSN no Administrador da fonte de dados.
Campos Um vetor de objetos de coluna que especifica um mapeamento de colunas de dados no banco de dados para campos de dados no mecanismo de execução do servidor da análise de big data. Cada coluna tem entradas Nome da coluna e Nome do campo. O Nome da Coluna é uma expressão de coluna SQL que deve ser válida no contexto da tabela identificada pelo Identificador da Tabela descrito acima. Pode ser um nome de coluna ou qualquer expressão SQL com base em qualquer número de colunas na tabela. Uma função de formatação pode ser necessária para converter valores de certos tipos de dados em strings de uma forma que não perca precisão. Todos os dados são convertidos implicitamente em strings usando o método de formatação padrão do banco de dados, o que pode causar perda de dados para alguns tipos de dados de coluna (como tipos de dados de data/hora) se expressões de formatação explícita não forem usadas.
Aumentando a coluna ID
Um nome de coluna ou uma expressão de coluna SQL que atende ao critério que aumenta (ou pelo menos não diminui) à medida que novas linhas são adicionadas. Ou seja, se a Linha B for adicionada à tabela em um momento posterior à Linha A, o valor dessa coluna (ou expressão de coluna) na Linha B deverá ser maior (de acordo com a ordem de classificação nativa do banco de dados) do que o valor correspondente na Linha A.
  • O nome da Coluna de ID crescente pode ser igual ao nome de uma coluna existente, mas não precisa ser.
  • Pressupõe-se que essa expressão tenha um tipo de dados de caractere SQL. Se a coluna de ID que realmente aumenta for de algum outro tipo de dados, esse valor deverá ser uma expressão de coluna para convertê-la em uma string. Como isso geralmente significa que as comparações são lexicográficas (caractere por caractere), é importante formatar o valor cuidadosamente.
  • A expressão é usada nas cláusulas SQL ORDER BY e comparada nas cláusulas SQL WHERE. É extremamente importante ter um índice criado na expressão exata da coluna usada.
ID de origem do registro
O valor desse parâmetro pode ser qualquer string. Se um valor for especificado, esse parâmetro permitirá que você diferencie entradas de log de diferentes fontes de log para identificação de origem ou processamento direcionado. O campo x-log-source-id é preenchido com um valor que identifica a fonte de log para cada entrada de log. Por exemplo, se você quiser identificar entradas de log de uma fonte ODBC chamada ODBCSource01, digite de ODBCSource01. e essa string seria transmitida para o campo x-log-source-id para cada entrada de log dessa fonte.
Para obter informações sobre o campo x-log-source-id, consulte Campos de registro de dados de evento.
Executar no servidor Valor de índice no arquivo profile.cfg do servidor de processamento que faz as consultas ODBC para obter dados do banco de dados. (O parâmetro Servidores de processamento no arquivo profile.cfg lista todos os servidores de processamento do conjunto de dados, e cada servidor tem um valor de índice, sendo o primeiro 0.) O valor padrão é 0.
Identificador de tabela Uma expressão SQL que nomeia a tabela ou exibição a partir da qual os dados devem ser carregados. Um identificador de tabela típico tem o formato SCHEMA.TABLE.
Este exemplo mostra a janela Log Processing de configuração na análise de big data com uma fonte de dados ODBC. Esta Fonte de Dados obtém dados de uma tabela chamada VISUAL.VSL em um banco de dados com Data Source Name "VSTestO". Cinco (5) objetos de coluna ( Fields) mapeiam dados das colunas de dados no banco de dados para o servidor de análise de big data.