Show Menu
ARGOMENTI×

Origini log

Le origini di registro sono file che contengono i dati da utilizzare per creare un dataset.
I dati disponibili nelle origini del registro sono denominati dati evento perché ogni record di dati rappresenta un record di transazione o una singola istanza di un evento. Il server workbench dati può elaborare origini di registro derivate da dati raccolti da Sensors o estratti da altre origini dati.
  • Dati raccolti da Sensors: I dati raccolti dai server Sensors HTTP e applicativi vengono trasmessi ai server workbench di dati, che convertono i dati in file di registro ( .vsl) altamente compressi. Consultate File Sensor .
  • Dati estratti da Insight Server: Il server workbench dati legge i dati degli eventi contenuti in file semplici, file XML o database conformi a ODBC e utilizza i relativi decoder per estrarre gli elementi desiderati dei dati. Tali dati evento non devono necessariamente risiedere nella memoria, ma i record che contengono i dati devono includere un ID di tracciamento. Vedere File di registro, origini di registro XML e origini dati ODBC.
Per aggiungere un'origine di registro
  1. Aprire Log Processing.cfg in workbench dati.
  2. Fare clic con il pulsante destro del mouse Log Sources e quindi scegliere Add New .
  3. Seleziona una delle seguenti opzioni:
    • Sensor
    • Log File
    • XML Log Source
    • ODBC Data Source
  4. I parametri specifici utilizzati per definire un dataset variano in base al tipo di origine del log da utilizzare nel processo di configurazione del dataset. Specificate i parametri come indicato nella sezione corrispondente all'origine di registro appropriata:
  5. Dopo aver definito l'origine del registro (e aver apportato modifiche ad altri parametri) nel Log Processing.cfg file, salvarlo localmente e salvarlo nel profilo del dataset sul server workbench dati.
    Un server workbench dati File Server Unit può ricevere e archiviare Sensor file, file di registro e file XML e inviarli al server Workbench dati Data Processing Units che crea il dataset. Consultate Configurazione di un'unità del file server di Insight Server.
    È possibile aprire la configurazione di qualsiasi origine di registro da un Transformation Dependency Map. Per informazioni su Transformation Dependency Map, vedere Strumenti di configurazione DataSet.

Requisiti

I dati degli eventi raccolti dai server Sensors HTTP e applicativi vengono trasmessi ai server workbench dati, che convertono i dati in file di registro ( .vsl) altamente compressi. Il formato di .vsl file è gestito dal server workbench dati e ogni file ha un nome nel formato:
YYYYMMDD- SENSORID .VSL
dove YYYMMDD è la data del file, e SENSORID è il nome (assegnato dalla tua organizzazione) che indica quali dati Sensor hanno raccolto e trasmesso al server workbench dati.

Parametri

Per Sensor i file sono disponibili i seguenti parametri:
Parametro Descrizione
Percorsi registro
Le directory in cui sono memorizzati i file .vsl . Il percorso predefinito è la directory Logs. Un percorso relativo fa riferimento alla directory di installazione del server workbench dati.
Potete utilizzare i caratteri jolly per specificare quali file .vsl elaborare:
  • * restituisce un numero qualsiasi di caratteri
  • ? corrisponde a un singolo carattere
Ad esempio, il percorso di registro Logs\*.vsl corrisponde a qualsiasi file presente nella directory Logs che termina con .vsl . Il percorso di registro Logs\*-SENSOR?.vsl corrisponde ai file nella directory Logs con qualsiasi data (YYYYMMDD) e un singolo carattere dopo SENSOR, come in SENSOR1.
Se si desidera eseguire la ricerca in tutte le sottodirectory del percorso specificato, è necessario impostare il parametro ricorsivo su true.
Nota: Se i file devono essere letti da un'unità file server del workbench di dati, è necessario immettere gli URI appropriati nel parametro Percorsi di registro. Ad esempio, l' URI /Logs/*-*.vsl corrisponde a qualsiasi file .vsl presente nella directory Logs. Consultate Configurazione di un'unità server di file Insight Server.
Registro server Informazioni (Indirizzo, Nome, Porta e così via) necessarie per connettersi a un file server. Se nel parametro del server di registro è presente una voce, i percorsi di registro vengono interpretati come URI. In caso contrario, vengono interpretati come percorsi locali. Consultate Configurazione di un'unità server di file Insight Server.
ID origine registro
Il valore di questo parametro può essere una qualsiasi stringa. Se viene specificato un valore, questo parametro consente di distinguere le voci di registro da diverse origini di registro per l'identificazione dell'origine o l'elaborazione mirata. Il campo x-log-source-id è popolato con un valore che identifica l’origine del registro per ciascuna voce di registro. Ad esempio, se si desidera identificare le voci di registro da un sensore denominato VSensor01, è possibile digitare da VSensor01 e tale stringa viene passata al campo x-log-source-id per ogni voce di registro proveniente da tale origine.
Per informazioni sul campo x-log-source-id, consultate Campi record dati evento .
Ricorsivo True o false. Se è impostato su true, tutte le sottodirectory di ciascun percorso specificato nei percorsi di registro sono alla ricerca di file che corrispondono al nome di file o al pattern di caratteri jolly specificato. Il valore predefinito è false.
Usa ora di inizio/fine
True o false. Se si specifica true e Ora di inizio o Ora di fine, tutti i file per questa origine di registro devono avere nomi di file che iniziano con le date in formato ISO (AAAAMMGG). Si presume che ciascun file contenga dati per un giorno GMT (ad esempio, l'intervallo di tempo che inizia alle 0000 GMT di un giorno e termina alle 0000 GMT del giorno successivo). Se i file delle origini del registro contengono dati che non corrispondono a un giorno GMT, questo parametro deve essere impostato su false per evitare risultati errati.
Nota: Per impostazione predefinita, .vsl i file contenenti i dati raccolti dal sensore soddisfano automaticamente i requisiti di denominazione e intervallo di tempo descritti in precedenza. Se si imposta questo parametro su true, il server workbench dati elabora sempre i dati dai file i cui nomi includono date ISO che rientrano tra l'ora di inizio e l'ora di fine specificate. Se si imposta questo parametro su false, il server workbench dati legge tutti i file .vsl durante l'elaborazione del registro per determinare quali file contengono dati nell'intervallo Ora di inizio e Ora di fine.
Per informazioni sui parametri Ora di inizio e Ora di fine, vedere Filtri dati.
Non utilizzare i parametri di configurazione per le origini Sensor dati per determinare quali voci di registro includere in un file di registro. Impostare invece l'origine dati in modo che punti a tutti i file di registro all'interno di una directory. Quindi utilizzate i parametri Ora di inizio e Ora di fine di Log Processing.cfg per determinare le voci di registro da utilizzare nella costruzione del dataset. Consulta Filtri dati .
Il file contenente i dati dell'evento deve soddisfare i seguenti requisiti:
  • Ogni record di dati evento nel file deve essere rappresentato da una riga.
  • I campi all'interno di un record devono essere separati, vuoti o meno, da un delimitatore ASCII. Il server workbench dati non richiede l'utilizzo di un delimitatore specifico. È possibile utilizzare qualsiasi carattere che non sia un carattere di fine riga e che non venga visualizzato in alcun punto all'interno dei dati dell'evento stesso.
  • Ogni record del file deve contenere:
    • Un ID di tracciamento
    • Timestamp
  • Per specificare l'ora di inizio e di fine dell'elaborazione dati, ogni nome file deve essere del modulo:
    • YYYYMMDD-SOURCE.log
    dove YYYMMDD è il giorno di Greenwich Mean Time (GMT) di tutti i dati nel file, e SOURCE è una variabile che identifica l'origine dei dati contenuti nel file.
    Contattate i servizi di consulenza Adobe per una revisione dei file di registro che prevedete di incorporare nel dataset.

Parametri

Per le origini di registro dei file di registro, sono disponibili i parametri nella tabella seguente.
L'elaborazione delle origini di registro dei file di registro richiede parametri aggiuntivi definiti in un Log Processing Dataset Include file, che contiene un sottoinsieme dei parametri inclusi in un Log Processing.cfg file, nonché parametri speciali per la definizione dei decodificatori per l'estrazione dei dati dal file di registro. Per informazioni sulla definizione dei decodificatori per le origini di registro dei file di registro, vedere Gruppi decodificatori di file di testo.
Parametro Descrizione
Nome Identificatore per l'origine del file di registro.
Percorsi registro
Le directory in cui sono memorizzati i file di registro. Il percorso predefinito è la directory Logs. Un percorso relativo fa riferimento alla directory di installazione del server workbench dati.
È possibile utilizzare caratteri jolly per specificare quali file di registro elaborare:
  • * restituisce un numero qualsiasi di caratteri.
  • ? rileva un singolo carattere.
Ad esempio, il percorso di registro Logs\*.log corrisponde a qualsiasi file presente nella directory Logs che termina con .log .
Se si desidera eseguire la ricerca in tutte le sottodirectory del percorso specificato, è necessario impostare il parametro ricorsivo su true.
Se i file devono essere letti da un'unità file server del workbench di dati, è necessario immettere gli URI appropriati nel parametro Percorsi di registro. Ad esempio, l’ URI/Logs/*.log corrisponde a qualsiasi file .log presente nella directory Logs. Consultate Configurazione di un'unità server di file Insight Server.
Registro server Informazioni (Indirizzo, Nome, Porta e così via) necessarie per connettersi a un file server. Se nel parametro del server di registro è presente una voce, i percorsi di registro vengono interpretati come URI. In caso contrario, vengono interpretati come percorsi locali. Consultate Configurazione di un'unità server di file Insight Server.
Compresso True o false. Questo valore deve essere impostato su true se i file di registro da leggere dal server workbench dati sono file gzip compressi.
Gruppo decodificatore Nome del gruppo di decodificatori del file di testo da applicare all'origine del registro del file di registro. Questo nome deve corrispondere esattamente al nome del gruppo di decodificatori del file di testo corrispondente specificato nel file Log Processing Dataset Include . Consultate Gruppi c-text-file-dec-groups.translate.html#concept-0db34988e17c41bfb1797f1d8e78aabddecodificatori di file di testo.
ID origine registro
Il valore di questo parametro può essere una qualsiasi stringa. Se viene specificato un valore, questo parametro consente di distinguere le voci di registro da diverse origini di registro per l'identificazione dell'origine o l'elaborazione mirata. Il campo x-log-source-id è popolato con un valore che identifica l’origine del registro per ciascuna voce di registro. Ad esempio, se si desidera identificare le voci di registro da un'origine di file di registro denominata LogFile01, è possibile digitare da LogFile01 e tale stringa viene passata al campo x-log-source-id per ogni voce di registro proveniente da tale origine.
Per informazioni sul campo x-log-source-id, consultate Campi record dati evento .
Pattern maschera
Un'espressione regolare con un singolo pattern di cattura che estrae un nome coerente utilizzato per identificare l'origine di una serie di file di registro. Viene considerato solo il nome del file. Il percorso e l'estensione non vengono considerati per la corrispondenza dell'espressione regolare. Se non si specifica un pattern di maschera, viene generata automaticamente una maschera.
Per i file Logs\010105server1.log e Logs\010105server2.log , il pattern della maschera sarebbe [0-9]{6}(.*). Questo pattern estrae la stringa "server1" o "server2" dai nomi di file riportati sopra.
Consultate Espressioni regolari.
Ricorsivo True o false. Se questo parametro è impostato su true, tutte le sottodirectory di ciascun percorso specificato nei percorsi di registro vengono cercate nei file che corrispondono al nome di file o al pattern di caratteri jolly specificato. Il valore predefinito è false.
Rifiuta file Percorso e nome del file contenente le voci di registro che non soddisfano le condizioni del decodificatore.
Usa ora di inizio/fine
True o false. Se questo parametro è impostato su true e si specifica Ora di inizio o Ora di fine, tutti i file per questa origine di registro devono avere nomi di file che iniziano con le date in formato ISO (AAAAMMGG). Si presume che ciascun file contenga dati per un giorno GMT (ad esempio, l'intervallo di tempo che inizia alle 0000 GMT di un giorno e termina alle 0000 GMT del giorno successivo). Se i nomi dei file delle origini di registro non iniziano con le date ISO, o se i file contengono dati che non corrispondono a un giorno GMT, allora questo parametro deve essere impostato su false per evitare risultati errati.
Nota: Se i requisiti di denominazione e intervallo di tempo descritti in precedenza sono soddisfatti per i file di registro e impostate questo parametro su true, il gruppo di decodificatori del file di testo specificato limita i file letti a quelli i cui nomi hanno date ISO comprese tra l’ora di inizio e l’ora di fine specificate. Se si imposta questo parametro su false, il server workbench dati legge tutti i file di registro durante l'elaborazione del registro per determinare quali file contengono dati nell'intervallo Ora di inizio e Ora di fine.
Per informazioni sui parametri Ora di inizio e Ora di fine, vedere Filtri dati.
In questo esempio, il dataset è costruito da due tipi di origini di registro.
Origine registro 0 specifica i file di registro generati dai dati dell'evento acquisiti da Sensor. Questa origine dati punta a una directory denominata Logs e a tutti i file in quella directory con un'estensione del nome .vsl file.
Log Source 1 punta a tutti i file della directory Logs con estensione .txt del nome file. Il gruppo di decodificatori per questa origine di registro è denominato "Registri di testo".
Non eliminare o spostare i file di registro dopo che sono state definite le origini dati per un dataset. Solo i file di registro appena creati devono essere aggiunti alla directory per le origini dati.
Il file contenente i dati dell'evento deve soddisfare i seguenti requisiti:
  • I dati dell'evento devono essere inclusi in un file XML formattato correttamente con relazioni padre-figlio appropriate.
  • Per ogni formato di file XML deve esistere un gruppo di decodificatori univoco. Per informazioni sulla creazione di un gruppo di decodificatori, consultate Gruppi decodificatori XML.
  • Ogni record visitatore nel file deve contenere:
    • Un ID di tracciamento
    • Timestamp
  • Per specificare l'ora di inizio e di fine dell'elaborazione dati, ogni nome file deve essere del modulo
YYYYMMDD-SOURCE.log
dove YYYMMDD è il giorno di Greenwich Mean Time (GMT) di tutti i dati nel file, e SOURCE è una variabile che identifica l'origine dei dati contenuti nel file.
Per un esempio di file XML che soddisfa tali requisiti, vedere Gruppi decodificatori XML.
Per una revisione dei file di registro XML che si intende incorporare nel dataset, contattare Adobe Consulting Services.

Parametri

Per le origini di registro XML, sono disponibili i parametri della tabella seguente.
L'elaborazione delle origini di registro XML richiede parametri aggiuntivi definiti in un Log Processing Dataset Include file, che contiene un sottoinsieme dei parametri inclusi in un Log Processing.cfg file, nonché parametri speciali per la definizione dei decodificatori per l'estrazione dei dati dal file XML. Per informazioni sulla definizione dei decodificatori per le origini di registro XML, vedere Gruppi decodificatori XML.
Campo Descrizione
Nome Identificatore per l'origine del registro XML.
Percorsi registro
Le directory in cui sono memorizzate le origini di registro XML. Il percorso predefinito è la directory Logs. Un percorso relativo fa riferimento alla directory di installazione del server workbench dati.
È possibile utilizzare caratteri jolly per specificare quali origini di registro XML elaborare:
  • * restituisce un numero qualsiasi di caratteri
  • ? corrisponde a un singolo carattere
Ad esempio, il percorso di registro Logs\*.xml corrisponde a qualsiasi file presente nella directory Logs che termina con .xml .
Se si desidera eseguire la ricerca in tutte le sottodirectory del percorso specificato, è necessario impostare il campo Ricorsivo su true.
Nota: Se i file devono essere letti da un'unità file server del workbench di dati, è necessario immettere gli URI appropriati nel campo dei percorsi di log. Ad esempio, l’ URI/Logs/*.xml corrisponde a qualsiasi file .xml presente nella directory Logs. Consultate Configurazione di un'unità server di file Insight Server.
Registro server Informazioni (Indirizzo, Nome, Porta e così via) necessarie per connettersi a un file server. Se è presente una voce nel campo Server di registro, i percorsi di registro vengono interpretati come URI. In caso contrario, vengono interpretati come percorsi locali. Consultate Configurazione di un'unità server di file Insight Server.
Compresso True o false. Questo valore deve essere impostato su true se le origini di registro XML da leggere dal server workbench dati sono file gzip compressi.
Gruppo decodificatore Nome del gruppo di decodificatori XML da applicare all'origine di registro XML. Questo nome deve corrispondere esattamente al nome del gruppo di decodificatori XML corrispondente specificato nel file Log Processing Dataset Include . Consultate Gruppi c-xml-dec-grps.translate.html#concept-5eda5ab253724674832f6951e2a0d1c3decoder XML.
ID origine registro
Il valore di questo campo può essere una qualsiasi stringa. Se viene specificato un valore, questo campo consente di distinguere le voci di registro da origini di registro diverse per l'identificazione dell'origine o l'elaborazione mirata. Il campo x-log-source-id è popolato con un valore che identifica l’origine del registro per ciascuna voce di registro. Ad esempio, se si desidera identificare le voci di registro da un'origine di file di registro denominata XMLFile01, è possibile digitare da XMLFile01 e passare tale stringa al campo x-log-source-id per ogni voce di registro proveniente da tale origine.
Per informazioni sul campo x-log-source-id, consultate Campi record dati evento .
Pattern maschera
Un'espressione regolare con un singolo pattern di cattura che estrae un nome coerente utilizzato per identificare l'origine di una serie di file di registro. Viene considerato solo il nome del file. Il percorso e l'estensione non vengono considerati per la corrispondenza dell'espressione regolare. Se non si specifica un pattern di maschera, viene generata automaticamente una maschera.
Per i file Logs\010105server1.xml e Logs\010105server2.xml , il pattern della maschera sarebbe [0-9]{6}(.*). Questo pattern estrae la stringa "server1" o "server2" dai nomi di file riportati sopra.
Consultate Espressioni regolari.
Ricorsivo True o false. Se questo parametro è impostato su true, tutte le sottodirectory di ciascun percorso specificato nei percorsi di registro vengono cercate nei file che corrispondono al nome di file o al pattern di caratteri jolly specificato. Il valore predefinito è false.
Rifiuta file Percorso e nome del file contenente le voci di registro che non soddisfano le condizioni del decodificatore.
Usa ora di inizio/fine
True o false. Se questo parametro è impostato su true e si specifica Ora di inizio o Ora di fine, tutti i file per questa origine di registro devono avere nomi di file che iniziano con le date in formato ISO (AAAAMMGG). Si presume che ciascun file contenga dati per un giorno GMT (ad esempio, l'intervallo di tempo che inizia alle 0000 GMT di un giorno e termina alle 0000 GMT del giorno successivo). Se i nomi dei file delle origini di registro non iniziano con le date ISO, o se i file contengono dati che non corrispondono a un giorno GMT, allora questo parametro deve essere impostato su false per evitare risultati errati.
Nota: Se i requisiti di denominazione e intervallo di tempo descritti in precedenza sono soddisfatti per i file XML e impostate questo parametro su true, il gruppo di decodificatori XML specificato limita i file letti a quelli i cui nomi hanno date ISO comprese tra l'ora di inizio e l'ora di fine specificate. Se si imposta questo parametro su false, il server workbench dati legge tutti i file XML durante l'elaborazione del registro per determinare quali file contengono dati nell'intervallo Ora di inizio e Ora di fine.
Per informazioni sui parametri Ora di inizio e Ora di fine, vedere Filtri dati.
Non eliminare o spostare le origini di registro XML dopo la definizione delle origini dati per un dataset. Solo i file XML appena creati devono essere aggiunti alla directory delle origini dati.
Il feed di dati Avro offre un modo più efficiente per integrare i dati in Workbench dati:
  • Avro fornisce un formato di origine singola per i dati relativi al traffico e al commercio.
  • Il feed Avro è compresso con dati di più blocchi sorgente forniti al giorno. Fornisce solo campi popolati e fornisce funzioni di monitoraggio e notifica, accesso ai dati storici e auto-ripristino.
  • Lo schema, un layout autodefinito dei file di registro Avro, è incluso all'inizio di ciascun file.
  • I nuovi campi vengono aggiunti con le informazioni di supporto per l'acquisizione dei dati di Workbench dati senza che sia necessario apportare alcuna modifica al decodificatore. Questi includono:
    • Evar: 1-250 (precedentemente 1-75)
    • Eventi personalizzati: 1-1000 (contro 1-100)
    • Accesso a variabili di soluzione per dati mobili, social e video
Inoltre, l'utilizzo del feed Avro consente l'accesso immediato a tutti i nuovi campi del feed senza spegnimento, consentendo l'aggiornamento dei campi senza necessità di orari di servizio.
Il feed di dati Avro è impostato in file separati:
  • Un file di registro Avro: Questo è il formato di registro Avro generato dal decodificatore per formattare i dati di traffico e commercio.
  • Un file Decoder Avro: Questo file consente di mappare i valori nel nuovo formato Avro. È possibile impostare il decodificatore utilizzando Avro Decoder Wizard.

Procedura guidata Decoder Avro

Questa procedura guidata consente di impostare il file di registro del decodificatore Avro.
Per aprire, fare clic con il pulsante destro del mouse in un'area di lavoro e selezionare Admin > Procedure guidate > Decoder automatico .
Passaggio 1: Selezionate un file di registro virtuale.
In questo passaggio, potete selezionare un file di origine per lo schema Avro. Gli schemi sono accessibili da un file di registro (.log) o da un file di decodificatore esistente (.avrò). Gli schemi possono essere estratti da entrambi i file.
File di registro Avro
Fare clic per aprire un file di registro (.log) per visualizzare lo schema nella parte superiore del file di registro e generare il file di decodificatore.
File decodificatore Avro
Fare clic per aprire e modificare lo schema di un file decoder (.avrò) esistente.
Passaggio 2: Selezionare Campi di input.
Selezionare i campi di input da utilizzare nel set di dati per passare attraverso l'elaborazione del registro. Vengono visualizzati tutti i campi del file, consentendo di selezionare i campi per il feed.
Viene fornito un x-product(Generates row) campo se nei dati viene rilevata una matrice. Questo campo genera nuove righe per i dati nidificati di un array come campi di input. Ad esempio, se si dispone di una riga Hit con molti valori Product in un array, le righe verranno generate nel file di input per ogni prodotto.
Seleziona valori predefiniti
Selezionare i campi da identificare come set standard di campi predefiniti.
Seleziona tutto
Selezionate tutti i campi nel file.
Deseleziona tutto
Cancella tutti i campi nel file.
Passaggio 3: Selezionare i campi che vengono copiati per generare le righe.
Poiché è possibile creare nuove righe dai valori nidificati di un array, ogni nuova riga creata deve avere un ID di tracciamento e una marca temporale. Questo passaggio consente di selezionare i campi da copiare nelle righe del record padre, ad esempio un ID tracciamento e una marca temporale. È inoltre possibile selezionare altri valori da aggiungere a ogni riga.
Seleziona valori predefiniti
Selezionare un set standard di campi predefiniti che richiedono l'aggiunta di nuovi valori di colonna a ciascuna riga, ad esempio un ID di tracciamento e una marca temporale. Ad esempio, un hit_source campo è un valore predefinito che deve essere aggiunto a ogni nuova riga (è definito come valore predefinito nell'elenco). È possibile aggiungere altri valori di colonna a ogni riga, in base alle esigenze.
Seleziona tutto
Selezionate tutti i campi nel file.
Deseleziona tutto
Cancella tutti i campi nel file.
Utilizzare la casella Cerca per trovare i valori nell'elenco.
Passaggio 4: specifica il nome del decodificatore
Assegnate un nome per il gruppo di campi e salvate come file di decodifica. Il nome deve corrispondere al nome del gruppo Decoder specificato nell’origine del registro.
Passaggio 5: Salvate il file del decodificatore.
Il menu del file si apre per denominare il file decoder e salvarlo come .cfg file nella cartella Logs .