Show Menu
TEMAS×

Acerca del índice incremental

Puede utilizar el Índice incremental para indexar "partes" del sitio Web activo o en etapas, como una colección de páginas que se cambian con frecuencia.

Uso del índice incremental

El rendimiento de un índice incremental solo tarda unos segundos y resulta útil en sitios web de gran capacidad que pueden tardar muchas horas en indexarse completamente.
Cuando se genera un índice incremental, se muestra la información de estado, como la hora de inicio, el tiempo transcurrido y los errores durante el proceso de indexación. También se muestra información sobre el estado del último índice.
Puede detener o reiniciar el proceso de indexación incremental en cualquier momento.
Mientras el nuevo índice incremental se crea para el sitio web activo, los clientes pueden continuar buscando en el sitio con el último índice incremental.

Configuración de un índice incremental de un sitio Web escalonado

Puede configurar qué páginas de sitio Web desea incluir en el índice incremental especificando las direcciones URL de los sitios Web y las máscaras de URL.
Para configurar un índice incremental de un sitio Web escalonado
  1. En el menú de producto, haga clic en Index > Incremental Index > Configuration .
  2. En la Incremental Index Configuration página, utilice los distintos campos para especificar qué páginas desea indexar.
    Campo
    Descripción
    Agregar o actualizar direcciones URL
    Especifique las direcciones URL.
    El robot de búsqueda solo indexa los documentos especificados que han cambiado desde la última vez que indexó.
    Además, el robot de búsqueda sigue los vínculos contenidos dentro de los documentos especificados e indexa sólo los documentos que han cambiado.
    Este campo debe contener solo direcciones URL de documento y no máscaras, como en el ejemplo siguiente:
    https://www.mydomain.com/products/new.html
    Puede utilizar las palabras clave siguientes con la dirección URL:
    • noindex
      Si no desea indexar el texto de la página que coincide con una dirección URL especificada, pero desea seguir los vínculos de la página, agregue noindex después de la dirección URL, como en el ejemplo siguiente:
      https://www.mydomain.com/products/new.html noindex
      Asegúrese de separar noindex desde la dirección URL con un espacio; una coma no es un separador válido.
    • noseguir
      Si desea indexar el texto de la página que coincide con la dirección URL especificada, pero no desea seguir los vínculos de la página, agregue noseguir después de la dirección URL, como en el ejemplo siguiente:
      https://www.mydomain.com/products/new.html nofollow (en inglés)
      Asegúrese de separar noseguir desde la dirección URL con un espacio; una coma no es un separador válido.
    Buscar y actualizar máscaras URL
    Especifique máscaras de URL simples: ruta completa, ruta parcial o rutas que utilizan comodines o expresiones regulares.
    El robot de búsqueda encuentra todos los documentos e índices coincidentes sólo aquellos documentos que han cambiado desde la última vez que indexó.
    Además, el robot de búsqueda sigue los vínculos que están contenidos dentro de los documentos e índices coincidentes sólo de las páginas que han cambiado. Por ejemplo:
    https://www.mydomain.com/products/household/*.html
    También puede utilizar expresiones regulares como en el ejemplo siguiente:
    regexp ^https://www\.mydomain\.com/products/home/.*\.html$
    Consulte Expresiones regulares.
    También puede utilizar las palabras clave noseguir y noindex como se describe en Agregar o actualizar direcciones URL arriba.
    Incluir y excluir máscaras URL
    Especifique máscaras de URL simples de inclusión o exclusión: ruta completa, ruta parcial o rutas que utilizan comodines o expresiones regulares.
    El robot de búsqueda busca e indexa ("incluir") o ignora ("excluir") documentos en función del tipo de máscara especificada.
    Al indexar un sitio, se siguen las instrucciones en orden de aparición. Por ejemplo, la siguiente lista de máscaras:
    incluir https://www.mydomain.com/products/household/lightbulbs*.html
    exclude https://www.mydomain.com/products/
    indexa las páginas lightbulbs1.html y lightbulbs2.html . Sin embargo, no índice ninguna otra página que aparezca en el directorio products.
    Una máscara URL que aparece primero siempre tiene prioridad sobre una que aparece más adelante en la lista. Además, si el robot de búsqueda encuentra un documento que coincide tanto con una máscara de inclusión como con una máscara de exclusión, la máscara que se muestra primero tiene prioridad.
    También puede utilizar las palabras clave noseguir y noindex como se describe en Agregar o actualizar direcciones URL arriba.
    Incluir y excluir máscaras de fecha
    Especifique máscaras de fecha simples de inclusión o exclusión: ruta completa, ruta parcial o rutas que utilizan comodines o expresiones regulares.
    El robot de búsqueda busca e indexa ("incluir") o ignora ("excluir") documentos basados tanto en la dirección URL como en la fecha de los documentos.
    Puede utilizar los siguientes tipos de máscaras de fecha:
    • include-days NNN
      El robot de búsqueda indexa todos los documentos que coinciden con la máscara URL especificada y que son NNNN días o más antiguos.
      Puede seguir la máscara de dirección URL con una o más de las siguientes palabras clave:
      • noseguir
      • noindex
      • server-date
      Por ejemplo, la siguiente máscara incluye todos los documentos de la carpeta /archive/support que tengan 0 días o más:
      include-days 0 https://www.mydomain.com/archive/support/
    • include-date AAAA-MM-DD
      El robot de búsqueda indexa todos los documentos que coinciden con la máscara de dirección URL especificada y que son anteriores o anteriores a la fecha AAAA-MM-DD.
      Puede seguir la máscara de dirección URL con una o más de las siguientes palabras clave:
      • noseguir
      • noindex
      • server-date
      El siguiente ejemplo de máscara incluye todos los documentos de la carpeta /archive/ con fecha del 25 de julio de 2011 o antes de esa fecha:
      include-date 2011-07-25 https://www.mydomain.com/archive/
    • exclude-days NNN
      Deshabilite la indexación de todos los documentos que coincidan con la máscara URL especificada y que tengan NNNN días o más de antigüedad.
      Opcionalmente, puede seguir la máscara de dirección URL por palabra clave server-date .
      El siguiente ejemplo de máscara excluye del índice todos los archivos PDF que tengan 90 días o más de antigüedad:
      exclude-days 90 *.pdf
    • exclude-date AAAA-MM-DD
      Deshabilite la indexación de todos los documentos que coincidan con la máscara de URL especificada y tengan la antigüedad o la antigüedad anterior a la fecha AAAA-MM-DD.
      Opcionalmente, puede seguir la máscara de dirección URL por palabra clave server-date .
      En el siguiente ejemplo de máscara se excluyen todos los documentos de la carpeta /archive/ con fecha del 23 de abril de 2004 o antes de esa fecha:
      exclude-date 2004-04-23 https://www.mydomain.com/archive/
    Consulte Acerca de las máscaras de fecha.
    Eliminar direcciones URL
    Especifique las direcciones URL.
    El robot de búsqueda encuentra y elimina los documentos especificados del índice de búsqueda. Si una página especificada ya está en el índice de búsqueda, el robot la elimina antes de agregar o actualizar cualquier otra página.
    Este campo solo debe contener direcciones URL de documento y no máscaras.
    Buscar y eliminar máscaras URL
    Especifique máscaras de URL simples: ruta completa, ruta parcial o que utilizan comodines o expresiones regulares.
    Si la máscara de dirección URL especificada coincide con las páginas del índice de búsqueda, el robot de búsqueda elimina las páginas antes de agregar o actualizar cualquier otra página. Por ejemplo:
    https://www.mydomain.com/products/1998/household/*
    También puede utilizar expresiones regulares como en el ejemplo siguiente:
    regexp ^https://www\.mydomain\.com/products/199[567]/.*$
    Consulte Expresiones regulares.
  3. Haga clic Save Changes .
  4. (Opcional) Realice una de las siguientes acciones:

Configuración de la programación incremental de índices para un sitio web activo

Puede seleccionar la frecuencia del índice incremental y el tiempo base que se utiliza para rastrear y actualizar el índice incremental.
La hora seleccionada es local según la zona horaria configurada en Configuración de cuenta.
Los servidores Web suelen programarse para que no funcionen por mantenimiento a mitad de la noche. Si el servidor está inactivo durante un tiempo de índice programado, el proceso de indexación fallará. Asegúrese de seleccionar una hora del día cuando el servidor web esté disponible.
La programación de índice solo se aplica al índice activo; no se pueden programar índices escalonados.
Definición de la programación de índice incremental para un sitio web activo
  1. En el menú de producto, haga clic en Index > Incremental Index > Live Schedule .
  2. En la lista desplegable En la Incremental Index Schedule página, seleccione la frecuencia de indización en horas o minutos, en la lista Incrementally Index desplegable.
  3. En la lista Base Time desplegable, seleccione la hora de inicio en la que desea volver a generar un nuevo índice incremental.
  4. Haga clic Save Changes .

Ejecución de un índice incremental de un sitio Web activo o en un sitio Web en etapas

Puede utilizar el Índice incremental para indexar "partes" del sitio Web activo o en etapas, como una colección de páginas que se cambian con frecuencia.
Ejecutar un índice incremental de un sitio Web activo o en un sitio Web en etapas
  1. En el menú del producto, realice una de las siguientes acciones:
    • Haga clic en Index > Incremental Index > Live Index .
    • Haga clic en Index > Incremental Index > Staged Index .
  2. Haga clic Incremental Index Now .
  3. (Opcional) Si se producen errores de indexación, haga clic en View Errors para ver el registro asociado.

Visualización del registro de índice incremental de un sitio Web activo o en etapas

Cuando se completa un índice incremental activo o un índice incremental escalonado, puede ver el registro asociado para solucionar cualquier error que se produzca.
No puede exportar registros ni guardarlos. El registro permanece disponible para su visualización hasta que se produzca el nuevo índice.
Para ver el registro de índice incremental de un sitio Web activo o en etapas
  1. En el menú del producto, realice una de las siguientes acciones:
    • Haga clic en Index > Incremental Index > Live Log .
    • Haga clic en Index > Incremental Index > Staged Log .
  2. En la página de registro, en la parte superior o inferior, realice una de las siguientes acciones:
    • Utilice las opciones de navegación Prev , Next , Last o Go to line para desplazarse por el registro.
    • Utilice las opciones de visualización Errors only , Wrap line o Show para perfeccionar lo que ve.