Show Menu
ARGOMENTI×

Definizione delle trasformazioni di ricerca

Informazioni sulle trasformazioni che è possibile utilizzare per incorporare dati di ricerca nel dataset.
Si noti che non tutti i tipi possono essere utilizzati durante entrambe le fasi del processo di costruzione del set di dati.

Categorizzare

La Categorize trasformazione utilizza una tabella di ricerca a due colonne composta da coppie di pattern-stringa/valore. Durante questa trasformazione, il server workbench dati legge a turno ogni record di dati evento e confronta il contenuto di un campo designato nel record con ciascuna delle stringhe del pattern elencate nella prima colonna della tabella di ricerca. Se il campo designato corrisponde a una delle stringhe del pattern, il server workbench dati scrive il valore (trovato nella seconda colonna) associato alla stringa del pattern in un campo di output designato nel record.
Facoltativamente, le stringhe nella prima colonna della tabella di ricerca possono iniziare con il carattere ^ e/o terminare nel carattere $ per forzare la corrispondenza all'inizio e/o alla fine. Questa trasformazione non accetta espressioni regolari per la definizione delle condizioni di corrispondenza nella prima colonna. Se il valore di input è un vettore di stringhe, ogni stringa viene eseguita attraverso la trasformazione e i risultati vengono aggiunti a una stringa di output vettore.
Una Categorize trasformazione è generalmente più semplice e veloce che utilizzare una Regular Expression trasformazione per ottenere lo stesso risultato.
Il test della sottostringa utilizzato in Categorize è sensibile alle maiuscole/minuscole, salvo diversa indicazione utilizzando il Case Sensitive parametro.
Parametro Descrizione impostazione predefinita
Nome Nome descrittivo della trasformazione. Potete inserire un nome qualsiasi qui.
Distinzione tra maiuscole e minuscole True o false. Specifica se il test della sottostringa fa distinzione tra maiuscole e minuscole. true
Commenti Facoltativo. Note sulla trasformazione.
Condizione Condizioni in cui viene applicata la trasformazione.
impostazione predefinita Il valore predefinito da utilizzare se il test di condizione viene superato e nessuna voce nel file di classificazione corrisponde all'input, oppure se il campo di input non è definito nella voce di registro specificata.
Delimitatore
Stringa utilizzata per separare le colonne nel file di ricerca. Deve essere un singolo carattere di lunghezza.
Se si tiene premuto il tasto Ctrl e si fa clic con il pulsante destro del mouse all'interno del parametro Delimiter, viene visualizzato un menu Inserisci . Questo menu contiene un elenco di caratteri speciali che vengono spesso utilizzati come delimitatori.
Valori multipli True o false. Se è true, quando più righe del file corrispondono all'input, ciascuna corrispondenza determina l'aggiunta di un valore al vettore di output delle stringhe. Se è false, nell'output viene utilizzata solo la prima riga corrispondente del file. In quest'ultimo caso, se l'input è un vettore, l'output è anche un vettore di lunghezza equivalente. Se l'input è una stringa semplice, anche l'output è una stringa semplice. false
File Percorso e nome file del file di classificazione. I percorsi relativi riguardano la directory di installazione del server workbench dati. Questo file si trova in genere nella directory Ricerche all'interno della directory di installazione del server workbench dati.
Ingresso Il file di classificazione corrisponde alle relative sottostringhe rispetto al valore in questo campo per identificare la riga corrispondente nel file.
Uscita Nome del campo associato al risultato.
Considerazioni per la classificazione
  • Le modifiche ai file di ricerca nelle Categorize trasformazioni definite nel Transformation.cfg file o in un Transformation Dataset Include file richiedono la riconversione del set di dati. I file di ricerca per Categorize le trasformazioni definite nel Log Processing.cfg file o in un Log Processing Dataset Include file non sono soggetti a questa limitazione. Per informazioni sulla rielaborazione dei dati, vedere Rielaborazione e trasformazione .
  • Categorize le trasformazioni definite nel Log Processing.cfg file o in un Log Processing Dataset Include file ricaricano i file di ricerca ogni volta che i file di ricerca cambiano. Le modifiche non vengono applicate retroattivamente, ma vengono applicate a tutti i dati di registro letti dopo la modifica.
Questo esempio illustra l’utilizzo della Categorize trasformazione per integrare i dati di ricerca con i dati dell’evento raccolti dal traffico del sito Web. Supponiamo che un particolare sito Web abbia sezioni di business, e che vi sia il requisito di essere in grado di guardare e fare confronti in base al flusso di traffico e al valore generato dalle varie sezioni. È possibile creare un file di ricerca in cui siano elencate le sottostringhe utilizzate per identificare queste diverse sezioni.
Il file di ricerca Lookups\custommap.txt contiene la tabella seguente:
/products/
Prodotti
^/sport/
Sport
^/news/
News
...
...
Questo file di categorizzazione mappa tutto ciò che contiene la stringa "/products/" al valore "Products", qualsiasi cosa che inizia con "/Sports/" al valore "Sports", e qualsiasi cosa che inizia con "/news/" al valore "News". La seguente trasformazione di categorizzazione utilizza il valore nel campo cs-uri-stem come stringa all'interno della quale si sta cercando una sottostringa corrispondente. Il risultato della trasformazione viene inserito nel campo x-custommap.
Presupponendo che il parametro Valori multipli sia impostato su false, l'esempio produrrà i seguenti valori per x-custommap, in base ai valori elencati per cs-uri-stem.
cs-uri-stem
x-custommap
/sports/news/today.php
Sport
/sports/products/buy.php
Prodotti
/news/headlines.php
News
/news/products/subscribe.php
Prodotti
L'output è basato sull'ordine delle sottostringhe nel file di ricerca. Ad esempio, l' /sports/products/buy.php elemento cs-uri restituisce "Products". Anche se lo stelo URI inizia con "/Sports/"," la stringa "/products/" è elencata prima di "/Sports/" nel file di ricerca. Se il parametro Valori multipli fosse impostato su true, ci sarebbe un valore aggiuntivo per x-custommap, in quanto l'ultimo esempio corrisponderebbe a due righe nella tabella di ricerca: Prodotti e notizie.

FlatFileLookup

La FlatFileLookup trasformazione utilizza una tabella di ricerca composta da un numero qualsiasi di colonne e righe (sebbene, ricordate che si trova nella memoria). Durante questo tipo di trasformazione, il server workbench dati legge a turno ogni record di dati evento e confronta il contenuto di un campo designato nel record con ciascuno dei valori di una colonna designata della tabella di ricerca. Se esiste una corrispondenza, il server workbench dati scrive uno o più valori dalla riga corrispondente nella tabella di ricerca in uno o più campi di output designati nel record di dati dell'evento.
La tabella di ricerca utilizzata durante questa trasformazione viene compilata da un file semplice la cui posizione viene specificata al momento della definizione della trasformazione.
Parametro Descrizione impostazione predefinita
Nome Nome descrittivo della trasformazione. Potete inserire un nome qualsiasi qui.
Commenti Facoltativo. Note sulla trasformazione.
Condizione Condizioni in cui viene applicata la trasformazione.
impostazione predefinita Il valore predefinito da utilizzare se la condizione è soddisfatta e se nessuna voce nel file di ricerca corrisponde all'input.
Delimitatore
Stringa utilizzata per separare le colonne nel file di ricerca. Deve essere un singolo carattere di lunghezza.
Se si tiene premuto il tasto Ctrl e si fa clic con il pulsante destro del mouse all'interno del parametro Delimiter, viene visualizzato un menu Inserisci . Questo menu contiene un elenco di caratteri speciali che vengono spesso utilizzati come delimitatori.
File Percorso e nome del file di ricerca. I percorsi relativi riguardano la directory di installazione del server workbench dati. Questo file si trova in genere nella directory Ricerche all'interno della directory di installazione del server workbench dati.
Riga di intestazione True o false. Indica che la prima riga della tabella è una riga di intestazione da ignorare durante l'elaborazione.
Ingresso Nome colonna è il nome della colonna utilizzata per far corrispondere l’input alle righe del file. Se Riga di intestazione è true, può essere il nome di una colonna nel file di ricerca. In caso contrario, deve essere il numero di colonna basato su zero a cui corrispondere. Nome campo è il nome del campo utilizzato per individuare la riga nel file di ricerca.
Valori multipli
True o false. Determina se restituire un singolo valore (una riga corrispondente) o più valori (uno per ciascuna riga corrispondente).
Nota: Se Valori multipli è impostato su false, è necessario assicurarsi che non siano presenti più corrispondenze. Quando si verificano più corrispondenze, non è garantita la corrispondenza che verrà restituita.
Uscite
Un vettore di oggetti colonna (risultati) in cui ogni oggetto è definito dai nomi di colonna e campo.
Nome colonna è la colonna da cui viene ottenuto il valore di output. Se Riga di intestazione è true, può essere il nome di una colonna nel file di ricerca. In caso contrario, deve essere il numero di colonna basato su zero a cui corrispondere.
Nome campo è il nome del campo utilizzato per acquisire l’output. Notate che questo può essere un vettore di risultati, uno per ogni riga identificata nel caso in cui il parametro Valori multipli sia true.
ConsiderazioniFlatFileLookup
  • La corrispondenza tra il campo di input e il file di ricerca fa sempre distinzione tra maiuscole e minuscole.
  • Le modifiche ai file di ricerca nelle FlatFileLookup trasformazioni definite nel Transformation.cfg file o nei Transformation Dataset Include file richiedono la riconversione del set di dati. I file di ricerca per FlatFileLookup le trasformazioni definite nel Log Processing.cfg file o nei Log Processing Dataset Include file non sono soggetti a questa limitazione. Per informazioni sulla rielaborazione dei dati, vedere Rielaborazione e trasformazione .
  • FlatFileLookup le trasformazioni nel Log Processing.cfg file o nei Log Processing Dataset Include file ricaricano i file di ricerca ogni volta che i file di ricerca cambiano. Le modifiche non vengono applicate retroattivamente, ma vengono applicate a tutti i dati di registro letti dopo la modifica.
Questo esempio illustra l’utilizzo della FlatFileLookup trasformazione per integrare i dati di ricerca con i dati dell’evento raccolti dal traffico del sito Web. Supponete di voler isolare i partner del sito Web che inviano il traffico al sito Web e trasformare i loro ID partner in nomi più semplici. Puoi quindi utilizzare i nomi descrittivi per creare dimensioni estese e visualizzazioni che si mappano più chiaramente sulla relazione commerciale rispetto alla relazione sito-a-sito utilizzata per il traffico di routing.
La trasformazione di esempio esegue la ricerca nel campo cs(referrer-query) della coppia nome-valore PartnerID e, se presente, il file di ricerca Lookups\partners.txt viene utilizzato per confrontare il valore PartnerID con i valori nella Partner colonna della tabella. Se si trova una riga, al campo di output x-partner-name viene assegnato il nome dalla PrintName colonna della riga identificata.
Se la tabella di ricerca conteneva le informazioni seguenti:
ID
Partner,
Avviato
PrintName
1
P154
21 agosto 1999
Yahoo
2
P232
10 luglio 2000
Microsoft
3
P945
12 gennaio 2001
Amazon
Gli esempi seguenti verranno trasformati come segue:
  • Se cs(referrer)(PartnerID) ha restituito P232, al campo x-partner-name verrà assegnato il valore "Microsoft".
  • Se cs(referrer)(PartnerID) restituisse P100, al campo x-partner-name verrà assegnato il valore "No Partner".
  • Se cs(referrer)(PartnerID) non ha restituito alcun valore, al campo x-partner-name verrà assegnato il valore "No Partner" come specificato dal parametro Default.

ODBCLookup

La ODBCLookup trasformazione opera come una FlatFileLookup trasformazione. L'unica differenza è che la tabella di ricerca utilizzata durante questa trasformazione viene compilata da un database ODBC e non da un file semplice.
ODBCLookup Le trasformazioni possono essere eseguite solo durante la fase di trasformazione del processo di costruzione del dataset. Quando possibile, Adobe consiglia di utilizzare la FlatFileLookup trasformazione invece della ODBCLookup trasformazione. FlatFileLookup Le trasformazioni sono intrinsecamente più affidabili perché non dipendono dalla disponibilità di un sistema esterno. Inoltre, è meno rischioso che la tabella di ricerca venga modificata se risiede in un file semplice controllato localmente.
Parametro Descrizione impostazione predefinita
Nome Nome descrittivo della trasformazione. Potete inserire un nome qualsiasi qui.
Commenti Facoltativo. Note sulla trasformazione.
Condizione Condizioni in cui viene applicata la trasformazione.
Nome origine dati Un DSN, fornito da un amministratore del computer server workbench dati su cui viene elaborato il dataset, che fa riferimento al database da cui vengono caricati i dati.
Password database La password da utilizzare per la connessione al database. Se una password è stata configurata per il DSN nell'amministratore dell'origine dati, potrebbe essere lasciata vuota. Qualsiasi password qui fornita sostituisce la password configurata per il DSN nell'amministratore dell'origine dati.
ID utente database ID utente da utilizzare per la connessione al database. Se l'ID utente è stato configurato per il DSN nell'amministratore dell'origine dati, può essere lasciato vuoto. Qualsiasi ID utente fornito qui ha la precedenza sull'ID utente configurato per il DSN nell'amministratore dell'origine dati.
impostazione predefinita Il valore predefinito da utilizzare se la condizione è soddisfatta e nessuna voce nel file di ricerca corrisponde all'input.
Colonna di input Nome colonna è il nome della colonna o l'espressione SQL per i dati confrontati con l'input. Nome campo è il nome del campo contenente i dati da cercare.
Valori multipli
True o false. Determina se restituire un singolo valore (una riga corrispondente) o più valori (uno per ciascuna riga corrispondente).
Nota: Se Valori multipli è impostato su false, è necessario assicurarsi che non siano presenti più corrispondenze. Quando si verificano più corrispondenze, non è garantita la corrispondenza che verrà restituita.
Colonne di output
Un vettore di oggetti colonna (risultati) in cui ogni oggetto è definito dai nomi di colonna e di campo.
Nome colonna è il nome o l'espressione SQL per la colonna da cui viene ottenuto il valore di output. Nome campo è il nome del campo utilizzato per acquisire l’output.
Identificatore tabella Un'espressione SQL che assegna un nome alla tabella o alla vista da cui devono essere caricati i dati. Un identificatore di tabella tipico è costituito dal modulo SCHEMA.TABLE.
  • I parametri Nome origine dati, Database User ID​Database Passworde Identificatore tabella sono gli stessi parametri degli stessi nomi descritti per le origini dati ODBC. See ODBC Data Sources .
  • A differenza delle origini dati ODBC, ODBCLookup le trasformazioni non richiedono una colonna ID crescente. See ODBC Data Sources . Questo perché il contenuto della tabella di ricerca non deve essere modificato in alcun modo mentre il set di dati è attivo. Le modifiche in una tabella o vista di ricerca non possono essere rilevate fino a quando non viene eseguita la riconversione. Per informazioni sulla rielaborazione dei dati, vedere Rielaborazione e trasformazione .
Si supponga di voler convertire record DNS obsoleti in record aggiornati. Entrambi i set di record sono memorizzati in un database SQL. Per eseguire questa attività, fare riferimento a una tabella di ricerca generata dal database e sostituire i record DNS obsoleti.
La nostra trasformazione di esempio cerca le voci di registro per il campo s-dns e, se si trova, la tabella di ricerca VISUAL.LOOKUP viene utilizzata per confrontare la voce s-dns con le voci nella OLDDNS colonna della tabella. Se una riga si trova nella tabella, al campo di output s-dns viene assegnata la voce di record DNS aggiornata dalla NEWDNS colonna della riga identificata.