Show Menu
SUJETS×

Définition des transformations de recherche

Informations sur les transformations que vous pouvez utiliser pour incorporer des données de recherche dans le jeu de données.
Notez que tous les types ne peuvent pas être utilisés pendant les deux phases du processus de construction du jeu de données.

Catégoriser

La Categorize transformation utilise une table de recherche à deux colonnes composée de paires chaîne-modèle/valeur. Au cours de cette transformation, le serveur des outils de données lit chaque enregistrement de données d’événement à son tour et compare le contenu d’un champ désigné dans l’enregistrement à chacune des chaînes de modèle répertoriées dans la première colonne de la table de recherche. Si le champ désigné correspond à l’une des chaînes de modèle, le serveur de l’outil de données écrit la valeur (trouvée dans la deuxième colonne) associée à cette chaîne de modèle dans un champ de sortie désigné de l’enregistrement.
Les chaînes de la première colonne de la table de recherche peuvent éventuellement commencer par le caractère ^ et/ou se terminer par le caractère $ pour forcer la correspondance au début et/ou à la fin. Cette transformation n’accepte pas les expressions régulières pour définir les conditions de correspondance dans la première colonne. Si la valeur d’entrée est un vecteur de chaînes, chaque chaîne est exécutée dans la transformation et le ou les résultats sont ajoutés à un vecteur de chaîne de sortie.
Une Categorize transformation est généralement plus facile et plus rapide que l'utilisation d'une Regular Expression transformation pour accomplir la même chose.
Le test de sous-chaîne utilisé dans Categorize est sensible à la casse, sauf indication contraire à l’aide du Case Sensitive paramètre.
Paramètre Description Par défaut
Nom Nom descriptif de la transformation. Vous pouvez saisir n’importe quel nom ici.
Respect de la casse True ou false. Indique si le test de sous-chaîne est sensible à la casse. true
Commentaires Facultatif. Remarques sur la transformation.
Condition Conditions d’application de cette transformation.
Par défaut Valeur par défaut à utiliser si le test de condition réussit et qu’aucune entrée dans le fichier de catégorisation ne correspond à l’entrée, ou si le champ d’entrée n’est pas défini dans l’entrée de journal donnée.
Délimiteur
Chaîne utilisée pour séparer les colonnes dans le fichier de recherche. Doit être un caractère de longueur unique.
Si vous maintenez la touche Ctrl enfoncée et cliquez avec le bouton droit dans le paramètre Délimiteur, un menu Insertion s'affiche. Ce menu contient une liste de caractères spéciaux qui sont souvent utilisés comme délimiteurs.
Valeurs multiples True ou false. Si la valeur est true, lorsque plusieurs lignes du fichier correspondent à l’entrée, chaque correspondance entraîne l’ajout d’une valeur au vecteur de sortie des chaînes. Si la valeur est false, seule la première ligne correspondante du fichier est utilisée dans la sortie. Dans ce dernier cas, si l’entrée est un vecteur, la sortie est également un vecteur de longueur équivalente. Si l’entrée est une chaîne simple, la sortie est également une chaîne simple. false
Fichier Chemin et nom de fichier du fichier de catégorisation. Les chemins relatifs concernent le répertoire d’installation du serveur de l’outil de données. Ce fichier se trouve généralement dans le répertoire de recherche du répertoire d’installation du serveur de l’outil de données.
Entrée Le fichier de catégorisation compare ses sous-chaînes à la valeur de ce champ pour identifier la ligne correspondante dans le fichier.
Sortie Nom du champ associé au résultat.
Considérations relatives à la catégorisation
  • Les modifications apportées aux fichiers de recherche dans Categorize les transformations définies dans le Transformation.cfg fichier ou dans un Transformation Dataset Include fichier nécessitent une retransformation du jeu de données. Les fichiers de recherche pour Categorize les transformations définies dans le Log Processing.cfg fichier ou un Log Processing Dataset Include fichier ne sont pas soumis à cette restriction. Pour plus d’informations sur le retraitement de vos données, voir Retraitement et retransformation .
  • Categorize les transformations définies dans le Log Processing.cfg fichier ou un Log Processing Dataset Include fichier rechargent leurs fichiers de recherche chaque fois que les fichiers de recherche changent. Les modifications ne sont pas appliquées rétroactivement, mais elles s’appliquent à toutes les données de journal lues après le changement.
Cet exemple illustre l’utilisation de la Categorize transformation pour intégrer les données de recherche aux données d’événement collectées à partir du trafic du site Web. Supposons qu’un site Web particulier comporte des sections commerciales et qu’il soit nécessaire de pouvoir examiner et comparer le flux de trafic et la valeur générés par les différentes sections. Vous pouvez créer un fichier de recherche qui répertorie les sous-chaînes utilisées pour identifier ces différentes sections.
Le fichier de recherche Lookups\custommap.txt contient le tableau suivant :
/products/
Produits
^/sports/
Sports
^/actualités/
News
...
...
Ce fichier de catégorisation fait correspondre tout ce qui contient la chaîne "/products/" à la valeur "Products", tout ce qui commence par "/sports/" à la valeur "Sports" et tout ce qui commence par "/news/" à la valeur "News". La transformation de catégorisation suivante utilise la valeur du champ cs-uri-tige comme chaîne dans laquelle nous recherchons une sous-chaîne correspondante. Le résultat de la transformation est placé dans le champ x-custommap.
En supposant que le paramètre Plusieurs valeurs soit défini sur false, l’exemple produirait les valeurs suivantes pour x-custommap, en fonction des valeurs répertoriées pour cs-uri-stem.
cs-uri-stem
x-custommap
/sports/news/today.php
Sports
/sports/products/buy.php
Produits
/news/headlines.php
News
/news/products/subscribe.php
Produits
La sortie est basée sur l’ordre des sous-chaînes dans le fichier de recherche. Par exemple, le système cs-uri-stem /sports/products/buy.php renvoie "Products". Bien que la racine URI commence par "/sports/", la chaîne "/products/" est répertoriée avant "/sports/" dans le fichier de recherche. Si le paramètre Valeurs multiples était défini sur true, il y aurait une valeur supplémentaire pour x-custommap, car le dernier exemple correspondrait à deux lignes dans la table de recherche : Produits et actualités.

FlatFileLookup

La FlatFileLookup transformation utilise un tableau de recherche composé de n’importe quel nombre de colonnes et de lignes (bien que, rappelez-vous, il réside dans la mémoire). Pendant ce type de transformation, le serveur de l’outil de données lit chaque enregistrement de données d’événement à son tour et compare le contenu d’un champ désigné dans l’enregistrement à chacune des valeurs d’une colonne désignée de la table de choix. S’il existe une correspondance, le serveur de l’outil de données écrit une ou plusieurs valeurs de la ligne correspondante dans le tableau de recherche dans un ou plusieurs champs de sortie désignés dans l’enregistrement de données d’événement.
La table de recherche utilisée pendant cette transformation est renseignée à partir d’un fichier plat dont vous spécifiez l’emplacement lorsque vous définissez la transformation.
Paramètre Description Par défaut
Nom Nom descriptif de la transformation. Vous pouvez saisir n’importe quel nom ici.
Commentaires Facultatif. Remarques sur la transformation.
Condition Conditions d’application de cette transformation.
Par défaut Valeur par défaut à utiliser si la condition est remplie et si aucune entrée dans le fichier de recherche ne correspond à l’entrée.
Délimiteur
Chaîne utilisée pour séparer les colonnes dans le fichier de recherche. Doit être un caractère de longueur unique.
Si vous maintenez la touche Ctrl enfoncée et cliquez avec le bouton droit dans le paramètre Délimiteur, un menu Insertion s'affiche. Ce menu contient une liste de caractères spéciaux qui sont souvent utilisés comme délimiteurs.
Fichier Chemin et nom de fichier du fichier de recherche. Les chemins relatifs concernent le répertoire d’installation du serveur de l’outil de données. Ce fichier se trouve généralement dans le répertoire de recherche du répertoire d’installation du serveur de l’outil de données.
Rangée d’en-tête True ou false. Indique que la première rangée du tableau est une rangée d’en-tête à ignorer lors du traitement.
Entrée Nom de colonne est le nom de la colonne utilisée pour faire correspondre l’entrée aux lignes du fichier. Si la valeur Rangée d’en-tête est true, il peut s’agir du nom d’une colonne dans le fichier de recherche. Dans le cas contraire, il doit s’agir du numéro de colonne de base zéro contre lequel établir une correspondance. Nom de champ est le nom du champ utilisé pour localiser la ligne dans le fichier de recherche.
Valeurs multiples
True ou false. Détermine si une seule valeur (une ligne correspondante) ou plusieurs valeurs doivent être renvoyées (une pour chaque ligne correspondante).
Remarque : Si Plusieurs valeurs sont définies sur false, vous devez vous assurer qu’il n’y a pas plusieurs correspondances. Lorsque plusieurs correspondances se produisent, rien ne garantit que la correspondance sera renvoyée.
Sorties
Vecteur d’objets de colonne (résultats) dans lequel chaque objet est défini par les noms de colonne et de champ.
Le nom de colonne est la colonne à partir de laquelle la valeur de sortie est obtenue. Si la rangée d’en-tête est vraie, il peut s’agir du nom d’une colonne dans le fichier de recherche. Dans le cas contraire, il doit s’agir du numéro de colonne de base zéro contre lequel établir une correspondance.
Nom de champ est le nom du champ utilisé pour capturer la sortie. Notez qu’il peut s’agir d’un vecteur de résultats, un pour chaque ligne identifiée dans le cas où le paramètre Valeurs multiples a la valeur true.
Remarques concernantFlatFileLookup
  • La correspondance du champ d’entrée au fichier de recherche est toujours sensible à la casse.
  • Les modifications apportées aux fichiers de recherche dans FlatFileLookup les transformations définies dans le Transformation.cfg ou les fichiers Transformation Dataset Include nécessitent une retransformation du jeu de données. Les fichiers de recherche pour FlatFileLookup les transformations définies dans le Log Processing.cfg ou les fichiers Log Processing Dataset Include ne sont pas soumis à cette restriction. Pour plus d’informations sur le retraitement de vos données, voir Retraitement et retransformation .
  • FlatFileLookup les transformations dans le Log Processing.cfg fichier ou Log Processing Dataset Include les fichiers rechargent leurs fichiers de recherche chaque fois que les fichiers de recherche changent. Les modifications ne sont pas appliquées rétroactivement, mais elles s’appliquent à toutes les données de journal lues après le changement.
Cet exemple illustre l’utilisation de la FlatFileLookup transformation pour intégrer les données de recherche aux données d’événement collectées à partir du trafic du site Web. Supposons que vous souhaitiez isoler les partenaires du site Web qui acheminent le trafic vers le site Web et transformer leurs identifiants de partenaire en noms plus conviviaux. Vous pouvez ensuite utiliser les noms conviviaux pour créer des dimensions étendues et des visualisations qui correspondent plus clairement à la relation d’affaires que la relation site-à-site utilisée pour le routage du trafic.
L'exemple de transformation recherche dans le champ cs(referrer-query) la paire nom-valeur du PartnerID et, s'il se trouve, le fichier de recherche Lookups\partners.txt est utilisé pour comparer la valeur du PartnerID aux valeurs de la Partner colonne de la table. Si une ligne est localisée, le champ de sortie x-partner-name reçoit le nom de la PrintName colonne de la ligne identifiée.
Si la table de recherche contenait les informations suivantes :
ID
Partenaire
Démarré
PrintName
1
P154
21 août 1999
Yahoo
2
P232
10 juillet 2000
Microsoft
3
P945
12 janvier 2001
Amazon
Les exemples suivants se transformeront comme suit :
  • Si cs(referrer)(PartnerID) renvoie P232, le champ x-partner-name reçoit la valeur "Microsoft".
  • Si cs(referrer)(PartnerID) renvoie P100, le champ x-partner-name reçoit la valeur "No Partner".
  • Si cs(referrer)(PartnerID) ne renvoyait rien, le champ x-partner-name recevrait la valeur "No Partner" comme spécifié par le paramètre par défaut.

ODBCLookup

La ODBCLookup transformation opère comme une FlatFileLookup transformation. La seule différence est que la table de recherche utilisée pendant cette transformation est renseignée à partir d'une base de données ODBC et non d'un fichier plat.
ODBCLookup les transformations ne peuvent être exécutées que pendant la phase de transformation du processus de construction du jeu de données. Lorsque cela est possible, Adobe vous recommande d’utiliser la FlatFileLookup transformation plutôt que la ODBCLookup transformation. FlatFileLookup les transformations sont intrinsèquement plus fiables parce qu’elles ne dépendent pas de la disponibilité d’un système externe. De plus, il y a moins de risque que la table de recherche soit modifiée si elle réside dans un fichier plat dont vous avez le contrôle localement.
Paramètre Description Par défaut
Nom Nom descriptif de la transformation. Vous pouvez saisir n’importe quel nom ici.
Commentaires Facultatif. Remarques sur la transformation.
Condition Conditions d’application de cette transformation.
Nom de la source de données Un DSN, fourni par un administrateur de l’ordinateur serveur de l’outil de données sur lequel le jeu de données est traité, qui fait référence à la base de données à partir de laquelle les données doivent être chargées.
Mot de passe de base de données mot de passe à utiliser lors de la connexion à la base de données. Si un mot de passe a été configuré pour le DSN dans l’administrateur de la source de données, il se peut que vous ne l’ayez pas renseigné. Tout mot de passe fourni ici remplace le mot de passe configuré pour le DSN dans l’administrateur de la source de données.
ID utilisateur de base de données ID utilisateur à utiliser lors de la connexion à la base de données. Si un ID utilisateur a été configuré pour le DSN dans l’administrateur de la source de données, il est possible que ce champ ne soit pas renseigné. Tout ID utilisateur fourni ici remplace l’ID utilisateur configuré pour le DSN dans l’administrateur de la source de données.
Par défaut Valeur par défaut à utiliser si la condition est remplie et qu’aucune entrée dans le fichier de recherche ne correspond à l’entrée.
Colonne d’entrée Le nom de colonne est le nom de colonne ou l’expression SQL des données qui correspondent à l’entrée. Nom de champ est le nom du champ contenant les données à rechercher.
Valeurs multiples
True ou false. Détermine si une seule valeur (une ligne correspondante) ou plusieurs valeurs doivent être renvoyées (une pour chaque ligne correspondante).
Remarque : Si Plusieurs valeurs sont définies sur false, vous devez vous assurer qu’il n’y a pas plusieurs correspondances. Lorsque plusieurs correspondances se produisent, rien ne garantit que la correspondance sera renvoyée.
Colonnes de sortie
Vecteur d’objets de colonne (résultats) dans lequel chaque objet est défini par les noms de colonne et de champ.
Le nom de colonne est le nom ou l’expression SQL de la colonne à partir de laquelle la valeur de sortie est obtenue. Nom de champ est le nom du champ utilisé pour capturer la sortie.
Identifiant de tableau Expression SQL qui nomme la table ou la vue à partir de laquelle les données doivent être chargées. Un identifiant de tableau type se trouve dans le formulaire SCHEMA.TABLE.
  • Les paramètres Nom de la source de données, Database User ID, Database Passwordet Identifiant de table sont les mêmes que les paramètres des mêmes noms que ceux décrits pour les sources de données ODBC. See ODBC Data Sources .
  • Contrairement aux sources de données ODBC, ODBCLookup les transformations ne nécessitent pas une colonne d’ID croissante. See ODBC Data Sources . Cela est dû au fait que le contenu de la table de recherche ne doit en aucun cas changer tant que le jeu de données est actif. Les modifications d’une table ou d’une vue de recherche ne peuvent pas être détectées tant que la transformation n’a pas eu lieu. Pour plus d’informations sur le retraitement de vos données, voir Retraitement et retransformation .
Supposons que vous souhaitiez convertir des enregistrements DNS obsolètes en enregistrements mis à jour. Les deux ensembles d'enregistrements sont stockés dans une base de données SQL. Pour effectuer cette tâche, référencez une table de recherche générée à partir de la base de données et remplacez les enregistrements DNS obsolètes.
Notre exemple de transformation recherche le champ s-dns dans les entrées du journal et, s’il est situé, la table de recherche VISUAL.LOOKUP est utilisée pour comparer l’entrée s-dns aux entrées de la OLDDNS colonne du tableau. Si une ligne se trouve dans la table, le champ de sortie s-dns reçoit l'entrée d'enregistrement DNS mise à jour de la NEWDNS colonne de la ligne identifiée.