Show Menu
TEMAS×

Configuración específica de Web para el procesamiento de registros

Información sobre la configuración específica de la web que se define en el conjunto de datos de procesamiento de registros Incluya archivos que se entregan con perfiles de Adobe para el sitio.
El filtrado definido por esta configuración se produce después de que las entradas de registro abandonan los descodificadores y se aplican las transformaciones, pero antes de que el Log Entry Condition.

Filtrado de estado HTTP

Puede configurar la implementación de Site para eliminar las entradas de registro con códigos sc-status de 400 o superior del conjunto de datos. Las solicitudes correctas tienen códigos de estado inferiores a 400. La implementación predeterminada incluye un Log Processing Dataset Include archivo en el que se configura el filtrado de estado HTTP.
Para editar la configuración del filtrado de estado HTTP
  1. Abra el Profile Manager perfil del conjunto de datos y abra el Dataset\Log Processing\Traffic\HTTP Status Filter.cfg archivo.
    Si ha personalizado la implementación de Site, es posible que el archivo en el que existen estas opciones de configuración difiera de la ubicación descrita.
  2. Revise o edite los valores de los parámetros del archivo como desee. Utilice el siguiente ejemplo como guía.
    Para obtener información sobre la Range condición, consulte Condiciones .
  3. Guarde el HTTP Status Filter.cfg archivo haciendo clic con el botón derecho (modified) en la parte superior de la ventana y haciendo clic en Save .
  4. Para que los cambios realizados localmente surtan efecto, en la columna Profile Manager, haga clic con el botón secundario en la marca de verificación del archivo en la User columna y, a continuación, haga clic en Save to > < profile name > , donde nombre de perfil es el nombre del perfil del conjunto de datos o el perfil heredado al que pertenece el archivo de inclusión del conjunto de datos.
    No guarde el archivo de configuración modificado en ninguno de los perfiles internos proporcionados por Adobe, ya que los cambios se sobrescriben al instalar actualizaciones en estos perfiles.

Filtrado de robots

Puede configurar la implementación de Site para que utilice archivos de búsqueda para eliminar las entradas de registro generadas por robots conocidos, scripts de prueba y direcciones IP para los usuarios internos del conjunto de datos. La implementación predeterminada incluye un Log Processing Dataset Include archivo en el que se configura el filtrado de robots.
Para editar los ajustes de configuración para el filtrado de robots
  1. Abra el Profile Manager perfil del conjunto de datos y abra el Dataset\Log Processing\Traffic\Robot Filter.cfg archivo.
    Si ha personalizado la implementación de Site, es posible que el archivo en el que existen estas opciones de configuración difiera de la ubicación descrita.
  2. Revise o edite los parámetros del archivo utilizando el siguiente ejemplo e información como guías:
    El archivo incluye un NotRobotCondition parámetro definido por los tres parámetros siguientes:
    • Filtrado de robots sin distinción de mayúsculas y minúsculas: True o false. Si es true, el caso de la letra (arriba/abajo) no se tiene en cuenta en el filtrado de robots.
    • Archivo de búsqueda de robots, línea base: Ruta y nombre de archivo del archivo de texto que contiene una lista de agentes de usuario del explorador que son robots conocidos y que se van a filtrar fuera del conjunto de datos. Adobe proporciona el archivo de búsqueda de robots base. Si no especifica una ruta de acceso, el servidor del área de trabajo de datos busca este archivo en el directorio de búsquedas dentro del directorio de instalación del servidor del área de trabajo de datos.
    • Archivo de búsqueda Robot, ampliado: Ruta y nombre de archivo de un archivo de texto opcional que contiene una lista de agentes de usuario del explorador o direcciones IP que definen robots específicos de la implementación. Esta lista puede incluir robots de monitoreo interno, scripts de prueba y direcciones IP para usuarios internos que deben filtrarse fuera del conjunto de datos. Si no especifica una ruta de acceso, el servidor del área de trabajo de datos busca este archivo en el directorio de búsquedas dentro del directorio de instalación del servidor del área de trabajo de datos.
    Si el agente de usuario del explorador de una entrada de registro no aparece en ninguno de los archivos de búsqueda, la entrada de registro se considera generada por un visitante real y no se filtra desde el conjunto de datos.
    La coincidencia en los archivos de búsqueda de robots utiliza subcadenas para comparar con los campos de registro c-ip y cs(user-agent). Si la cadena de búsqueda comienza con "$" debe coincidir con la parte delantera de la cadena que se está probando y si termina con "$" la cadena de búsqueda debe coincidir con el final de la cadena que se está probando. Si la cadena de búsqueda comienza con y termina con "$", las cadenas deben coincidir exactamente para que la entrada de registro se filtre. Por ejemplo, para probar todas las direcciones IP de un bloque de clase C, debe utilizar una cadena como $231.78.123. para forzar una coincidencia al principio de la cadena. Esto coincidiría con las direcciones 231.78.123.0 a 231.78.123.255.
  3. Para guardar el archivo, haga clic con el botón secundario (modified) en la parte superior de la ventana y haga clic en Save .
  4. Para que los cambios realizados localmente surtan efecto, en la columna Profile Manager, haga clic con el botón secundario en la marca de verificación del archivo en la User columna y, a continuación, haga clic en Save to > < profile name > , donde nombre de perfil es el nombre del perfil del conjunto de datos o el perfil heredado al que pertenece el archivo de inclusión del conjunto de datos.
    No guarde el archivo de configuración modificado en ninguno de los perfiles internos proporcionados por Adobe, ya que los cambios se sobrescriben al instalar actualizaciones en estos perfiles.
    Si es fundamental que las entradas de registro subyacentes utilizadas para construir un conjunto de datos no cambien (incluso si cambian las transformaciones utilizadas para construir y actualizar el conjunto de datos y sus dimensiones), el archivo de búsqueda Robot, Baseline y el archivo de búsqueda Robot, Extended, deben estar controlados por la versión. Al colocar un número de versión en estos archivos, se garantiza que las actualizaciones de los archivos de búsqueda robot predeterminados no cambien de forma involuntaria los conjuntos de datos de informes creados previamente mediante la adición o eliminación de entradas en estos archivos.