Show Menu
TEMAS×

Definición de transformaciones de búsqueda

Información sobre las transformaciones que puede utilizar para incorporar datos de búsqueda en el conjunto de datos.
Tenga en cuenta que no todos los tipos se pueden utilizar durante ambas fases del proceso de construcción del conjunto de datos.

Categorizar

La Categorize transformación utiliza una tabla de búsqueda de dos columnas compuesta por pares de patrón-cadena/valor. Durante esta transformación, el servidor del área de trabajo de datos lee cada registro de datos de evento a su vez y compara el contenido de un campo designado en el registro con cada una de las cadenas de patrón enumeradas en la primera columna de la tabla de búsqueda. Si el campo designado coincide con una de las cadenas de patrón, el servidor del área de trabajo de datos escribe el valor (que se encuentra en la segunda columna) asociado a esa cadena de patrón en un campo de salida designado en el registro.
Las cadenas de la primera columna de la tabla de búsqueda pueden empezar con el carácter ^ y/o finalizar en el carácter $ para forzar la coincidencia al principio o al final. Esta transformación no acepta expresiones regulares para definir condiciones de coincidencia en la primera columna. Si el valor de entrada es un vector de cadenas, cada cadena se ejecuta a través de la transformación y los resultados se anexan a un vector de cadena de salida.
Una Categorize transformación es generalmente más fácil y rápida que usar una Regular Expression transformación para lograr lo mismo.
La prueba de subcadena utilizada en Categorize distingue entre mayúsculas y minúsculas a menos que se especifique lo contrario con el Case Sensitive parámetro .
Parámetro Descripción Valor predeterminado
Nombre Nombre descriptivo de la transformación. Aquí puede introducir cualquier nombre.
Distinción entre mayúsculas y minúsculas True o false. Especifica si la prueba de subcadena distingue entre mayúsculas y minúsculas. true
Comentarios Opcional. Notas sobre la transformación.
Condición Condiciones en las que se aplica esta transformación.
Valor predeterminado El valor predeterminado que se usará si la prueba de condición pasa y no hay ninguna entrada en el archivo de categorización que coincida con la entrada o si el campo de entrada no está definido en la entrada de registro dada.
Delimitador
Cadena que se utiliza para separar las columnas del archivo de búsqueda. Debe tener un solo carácter de longitud.
Si mantiene pulsada la tecla Ctrl y hace clic con el botón derecho en el parámetro Delimitador, aparecerá un menú Insertar . Este menú contiene una lista de caracteres especiales que a menudo se utilizan como delimitadores.
Valores múltiples True o false. Si es true, cuando varias filas del archivo coinciden con la entrada, cada coincidencia da como resultado que se anexe un valor al vector de salida de cadenas. Si es false, en el resultado solo se utiliza la primera fila coincidente del archivo. En este último caso, si la entrada es un vector, la salida es también un vector de longitud equivalente. Si la entrada es una cadena simple, el resultado también es una cadena simple. false
Archivo Ruta y nombre de archivo del archivo de categorización. Las rutas relativas se refieren al directorio de instalación del servidor del área de trabajo de datos. Este archivo se encuentra generalmente en el directorio de búsquedas dentro del directorio de instalación del servidor del área de trabajo de datos.
Entrada El archivo de categorización coincide con sus subcadenas con el valor de este campo para identificar la fila coincidente en el archivo.
Salida Nombre del campo asociado al resultado.
Consideraciones para categorizar
  • Los cambios realizados en los archivos de búsqueda en Categorize transformaciones definidas en el Transformation.cfg archivo o en un Transformation Dataset Include archivo requieren una retransformación del conjunto de datos. Los archivos de búsqueda de Categorize transformaciones definidas en el Log Processing.cfg archivo o en un Log Processing Dataset Include archivo no están sujetos a esta limitación. Para obtener información sobre el reprocesamiento de los datos, consulte Reprocesamiento y retransformación .
  • Categorize las transformaciones definidas en el Log Processing.cfg archivo o en un Log Processing Dataset Include archivo recargan sus archivos de búsqueda cada vez que cambian los archivos de búsqueda. Los cambios no se aplican de forma retroactiva, pero se aplican a todos los datos de registro leídos después de que se produzca el cambio.
Este ejemplo ilustra el uso de la transformación para integrar los datos de búsqueda con los datos de eventos recopilados a partir del tráfico del sitio web. Categorize Supongamos que un sitio web en particular tiene secciones comerciales y que existe el requisito de poder ver y realizar comparaciones en función del flujo de tráfico y el valor generados por las diferentes secciones. Puede crear un archivo de búsqueda que enumera las subcadenas utilizadas para identificar estas diferentes secciones.
El archivo de búsqueda Lookups\custommap.txt contiene la siguiente tabla:
/informe de productos/
Productos
^/deportes/
Deportes
^/noticias/
Noticias
...
...
Este archivo de categorización asigna cualquier cosa que contenga la cadena "/products/" al valor "Productos", cualquier cosa que comience con "/sports/" al valor "Deportes" y cualquier cosa que comience con "/news/" al valor "Noticias". La siguiente transformación de categorización utiliza el valor del campo cs-uri-stem como la cadena en la que se busca una subcadena coincidente. El resultado de la transformación se coloca en el campo x-custommap.
Suponiendo que el parámetro Valores múltiples se establece en false, el ejemplo generaría los siguientes valores para x-custommap dados los valores enumerados para cs-uri-stem.
cs-uri-stem
x-custommap
/sports/news/today.php
Deportes
/sports/products/buy.php
Productos
/news/headlines.php
Noticias
/news/products/subscribe.php
Productos
El resultado se basa en el orden de las subcadenas en el archivo de búsqueda. Por ejemplo, el cs-uri-stem /sports/products/buy.php devuelve "Productos". Aunque la derivación URI empieza por "/sports/", la cadena "/products/" aparece antes de "/sports/" en el archivo de búsqueda. Si el parámetro Valores múltiples se configurara en true, habría un valor adicional para x-custommap, ya que el último ejemplo coincidiría con dos filas en la tabla de búsqueda: Productos y noticias.

FlatFileLookup

La FlatFileLookup transformación utiliza una tabla de búsqueda compuesta por cualquier número de columnas y filas (aunque recuerde que reside en la memoria). Durante este tipo de transformación, el servidor del área de trabajo de datos lee cada registro de datos de eventos a su vez y compara el contenido de un campo designado en el registro con cada uno de los valores de una columna designada de la tabla de búsqueda. Si hay una coincidencia, el servidor del área de trabajo de datos escribe uno o más valores de la fila coincidente en la tabla de búsqueda en uno o más campos de salida designados en el registro de datos del evento.
La tabla de búsqueda utilizada durante esta transformación se rellena a partir de un archivo plano cuya ubicación se especifique al definir la transformación.
Parámetro Descripción Valor predeterminado
Nombre Nombre descriptivo de la transformación. Aquí puede introducir cualquier nombre.
Comentarios Opcional. Notas sobre la transformación.
Condición Condiciones en las que se aplica esta transformación.
Valor predeterminado El valor predeterminado que se usará si se cumple la condición y si no hay ninguna entrada en el archivo de búsqueda que coincida con la entrada.
Delimitador
Cadena que se utiliza para separar las columnas del archivo de búsqueda. Debe tener un solo carácter de longitud.
Si mantiene pulsada la tecla Ctrl y hace clic con el botón derecho en el parámetro Delimitador, aparecerá un menú Insertar . Este menú contiene una lista de caracteres especiales que a menudo se utilizan como delimitadores.
Archivo Ruta y nombre de archivo del archivo de búsqueda. Las rutas relativas se refieren al directorio de instalación del servidor del área de trabajo de datos. Este archivo se encuentra generalmente en el directorio de búsquedas dentro del directorio de instalación del servidor del área de trabajo de datos.
Fila de encabezado True o false. Indica que la primera fila de la tabla es una fila de encabezado que se debe ignorar al procesar.
Entrada Nombre de columna es el nombre de la columna que se utiliza para hacer coincidir la entrada con las filas del archivo. Si Fila de encabezado es verdadera, puede ser el nombre de una columna en el archivo de búsqueda. De lo contrario, debe ser el número de columna basado en cero con el que hacer coincidir. Nombre del campo es el nombre del campo utilizado para ubicar la fila en el archivo de búsqueda.
Valores múltiples
True o false. Determina si se debe devolver un valor único (una fila coincidente) o varios valores (uno por cada fila coincidente).
Nota: Si Valores múltiples se establece en false, debe asegurarse de que no haya coincidencias múltiples. Cuando se producen varias coincidencias, no hay garantía de qué coincidencia se devolverá.
Salidas
Un vector de objetos de columna (resultados) en el que cada objeto se define por los nombres de columna y campo.
Nombre de columna es la columna desde la que se obtiene el valor de salida. Si Fila de encabezado es verdadera, puede ser el nombre de una columna en el archivo de búsqueda. De lo contrario, debe ser el número de columna basado en cero con el que hacer coincidir.
Nombre del campo es el nombre del campo utilizado para capturar el resultado. Tenga en cuenta que puede ser un vector de resultados, uno para cada fila identificada en el caso de que el parámetro Valores múltiples sea true.
Consideraciones paraFlatFileLookup
  • La coincidencia del campo de entrada con el archivo de búsqueda siempre distingue entre mayúsculas y minúsculas.
  • Los cambios realizados en los archivos de búsqueda en FlatFileLookup las transformaciones definidas en el Transformation.cfg archivo o en los Transformation Dataset Include archivos requieren una retransformación del conjunto de datos. Los archivos de búsqueda de FlatFileLookup transformaciones definidas en el Log Processing.cfg archivo o Log Processing Dataset Include archivos no están sujetos a esta limitación. Para obtener información sobre el reprocesamiento de los datos, consulte Reprocesamiento y retransformación .
  • FlatFileLookup las transformaciones en el Log Processing.cfg archivo o Log Processing Dataset Include archivos recargan sus archivos de búsqueda cada vez que cambian los archivos de búsqueda. Los cambios no se aplican de forma retroactiva, pero se aplican a todos los datos de registro leídos después de que se produzca el cambio.
Este ejemplo ilustra el uso de la transformación para integrar los datos de búsqueda con los datos de eventos recopilados a partir del tráfico del sitio web. FlatFileLookup Supongamos que desea aislar a los socios del sitio web que dirigen el tráfico al sitio web y transformar sus ID de socio en nombres más prácticos. A continuación, puede utilizar los nombres descriptivos para crear dimensiones y visualizaciones ampliadas que se asignen más claramente a la relación comercial que a la relación sitio a sitio utilizada para enrutar el tráfico.
La transformación de ejemplo busca en el campo cs(referrer-query) el par nombre-valor de PartnerID y, si se encuentra, el archivo de búsqueda Lookups\partners.txt se utiliza para comparar el valor de PartnerID con los valores de la Partner columna de la tabla. Si se encuentra una fila, el campo de salida x-partner-name recibe el nombre de la PrintName columna de la fila identificada.
Si la tabla de búsqueda contenía la siguiente información:
ID
Socio
Iniciado
PrintName
1
P154
21 de agosto de 1999
Yahoo
2
P232
10 de julio de 2000
Microsoft
3
P945
12 de enero de 2001
Amazon
Los siguientes ejemplos se transformarían de la siguiente manera:
  • Si cs(referrer)(PartnerID) devolvía P232, el campo x-partner-name tendría el valor "Microsoft".
  • Si cs(referrer)(PartnerID) devolvía P100, el campo x-partner-name recibiría el valor "No Partner".
  • Si cs(referrer)(PartnerID) no devolvía nada, el campo x-partner-name recibiría el valor "No Partner" especificado por el parámetro Default.

ODBCLookup

La ODBCLookup transformación funciona como una FlatFileLookup transformación. La única diferencia es que la tabla de búsqueda utilizada durante esta transformación se rellena desde una base de datos ODBC y no desde un archivo plano.
ODBCLookup las transformaciones sólo se pueden ejecutar durante la fase de transformación del proceso de construcción del conjunto de datos. Cuando sea posible, Adobe recomienda utilizar la FlatFileLookup transformación en lugar de la ODBCLookup transformación. FlatFileLookup las transformaciones son intrínsecamente más fiables porque no dependen de la disponibilidad de un sistema externo. Además, hay menos riesgo de que la tabla de búsqueda se modifique si reside en un archivo plano que controla localmente.
Parámetro Descripción Valor predeterminado
Nombre Nombre descriptivo de la transformación. Aquí puede introducir cualquier nombre.
Comentarios Opcional. Notas sobre la transformación.
Condición Condiciones en las que se aplica esta transformación.
Nombre de la fuente de datos Un DSN, proporcionado por un administrador del equipo del servidor del área de trabajo de datos en el que se procesa el conjunto de datos, que hace referencia a la base de datos desde la que se van a cargar los datos.
Contraseña de base de datos La contraseña que se utilizará al conectarse a la base de datos. Si se ha configurado una contraseña para el DSN en el Administrador de fuentes de datos, esto puede dejarse en blanco. Cualquier contraseña proporcionada aquí anula la contraseña configurada para el DSN en el Administrador de fuentes de datos .
ID de usuario de base de datos ID de usuario que se utilizará al conectarse a la base de datos. Si se ha configurado un ID de usuario para el DSN en el Administrador de fuentes de datos, esto puede dejarse en blanco. Cualquier ID de usuario proporcionado aquí anula el ID de usuario configurado para el DSN en el Administrador de fuentes de datos.
Valor predeterminado El valor predeterminado que se usará si se cumple la condición y no hay ninguna entrada en el archivo de búsqueda que coincida con la entrada.
Columna de entrada Nombre de columna es el nombre de columna o la expresión SQL para los datos que coinciden con los datos introducidos. Nombre del campo es el nombre del campo que contiene los datos que se van a buscar.
Valores múltiples
True o false. Determina si se debe devolver un valor único (una fila coincidente) o varios valores (uno por cada fila coincidente).
Nota: Si Valores múltiples se establece en false, debe asegurarse de que no haya coincidencias múltiples. Cuando se producen varias coincidencias, no hay garantía de qué coincidencia se devolverá.
Columnas de salida
Un vector de objetos de columna (resultados) donde cada objeto se define por los nombres de columna y campo.
Nombre de columna es el nombre o la expresión SQL de la columna desde la que se obtiene el valor de salida. Nombre del campo es el nombre del campo utilizado para capturar el resultado.
Identificador de tabla Expresión SQL que asigna un nombre a la tabla o vista desde la que se van a cargar los datos. Un identificador de tabla típico tiene el formato SCHEMA.TABLE.
  • Los parámetros Nombre de fuente de datos, Database User ID, Database Passworde Identificador de tabla son los mismos que los parámetros de los mismos nombres que se describen para los orígenes de datos ODBC. See ODBC Data Sources .
  • A diferencia de los orígenes de datos ODBC, las transformaciones no requieren una columna de ID en aumento. ODBCLookup See ODBC Data Sources . Esto se debe a que el contenido de la tabla de búsqueda no debe cambiar de ninguna manera mientras el conjunto de datos esté activo. Los cambios en una tabla o vista de búsqueda no se pueden detectar hasta que se produzca la transformación. Para obtener información sobre el reprocesamiento de los datos, consulte Reprocesamiento y retransformación .
Supongamos que desea convertir registros DNS obsoletos en registros actualizados. Ambos conjuntos de registros se almacenan en una base de datos SQL. Para realizar esta tarea, debe hacer referencia a una tabla de búsqueda que se genera a partir de la base de datos y reemplazar los registros DNS obsoletos.
Nuestra transformación de ejemplo busca en las entradas de registro el campo s-dns y, si se encuentra, se utiliza la tabla de búsqueda VISUAL.LOOKUP para comparar la entrada s-dns con las entradas de la OLDDNS columna de la tabla. Si hay una fila en la tabla, se proporciona al campo de salida s-dns la entrada de registro DNS actualizada de la NEWDNS columna de la fila identificada.