Show Menu
TEMAS×

Acerca del menú Rastreo

Utilice el menú Rastreo para definir las máscaras de fecha y URL, las contraseñas, los tipos de contenido, las conexiones, las definiciones de formulario y los puntos de entrada de URL.

Acerca de los puntos de entrada de URL

La mayoría de los sitios Web tienen un punto de entrada o página de inicio principal que un cliente visita inicialmente. Este punto de entrada principal es la dirección URL desde la cual el robot de búsqueda comienza el rastreo de índice. Sin embargo, si el sitio web tiene varios dominios o subdominios, o si partes del sitio no están vinculadas desde el punto de entrada principal, puede utilizar puntos de entrada de URL para agregar más puntos de entrada.
Todas las páginas del sitio web debajo de cada punto de entrada de URL especificado se indexan. Puede combinar puntos de entrada de URL con máscaras para controlar exactamente qué partes de un sitio Web desea indexar. Debe volver a generar el índice del sitio web antes de que los efectos de la configuración de puntos de entrada de URL sean visibles para los clientes.
El punto de entrada principal suele ser la dirección URL del sitio Web que desea indexar y buscar. Puede configurar este punto de entrada principal en Configuración de cuenta.
Después de especificar el punto de entrada de la URL principal, puede especificar, opcionalmente, puntos de entrada adicionales que desee rastrear en orden. La mayoría de las veces especificará puntos de entrada adicionales para las páginas Web que no están vinculadas desde las páginas debajo del punto de entrada principal. Especifique puntos de entrada adicionales cuando el sitio web abarque más de un dominio, como en el siguiente ejemplo:
https://www.domain.com/
https://www.domain.com/not_linked/but_search_me_too/
https://more.domain.com/
Usted califica cada punto de entrada con una o más de las siguientes palabras clave separadas por espacios en la tabla a continuación. Estas palabras clave afectan la manera en que se indexa la página.
Importante : Asegúrese de separar una palabra clave determinada del punto de entrada y entre sí por un espacio; una coma no es un separador válido.
Palabra clave
Descripción
noindex
Si no desea indexar el texto en la página de puntos de entrada, pero sí desea seguir los vínculos de la página, agregue noindex después del punto de entrada.
Separe la palabra clave del punto de entrada con un espacio como en el ejemplo siguiente:
https://www.my-additional-domain.com/more_pages/main.html noindex
Esta palabra clave equivale a una etiqueta meta de robots con content="noindex" ) entre el <head> ... </head> de la página de puntos de entrada.
noseguir
Si desea indexar el texto en la página de puntos de entrada pero no desea seguir ninguno de los vínculos de la página, agregue nofollow después del punto de entrada.
Separe la palabra clave del punto de entrada con un espacio como en el ejemplo siguiente:
https://www.domain.com/not_linked/directory_listing&nbsp;nofollow
Esta palabra clave equivale a una etiqueta meta de robots con content="nofollow" entre el <head> ... </head> de una página de punto de entrada.
formulario
Cuando el punto de entrada es una página de inicio de sesión, generalmente form se utiliza para que el robot de búsqueda pueda enviar el formulario de inicio de sesión y recibir las cookies correspondientes antes de rastrear el sitio Web. Cuando se utiliza la palabra clave "formulario", la página de punto de entrada no se indiza y el robot de búsqueda no marca la página de punto de entrada como rastreada. Utilícelo nofollow si no desea que el robot de búsqueda siga los vínculos de la página.
Consulte también Acerca de los tipos de contenido.
Consulte también Acerca del conector de índice.

Añadir varios puntos de entrada de URL que desea indizar

Si el sitio web tiene varios dominios o subdominios y desea rastrearlos, puede utilizar los puntos de entrada de URL para agregar más direcciones URL.
Para establecer el punto de entrada de la URL principal del sitio web, utilice Configuración de cuenta.
Para agregar varios puntos de entrada de URL que desee indizar
  1. En el menú de producto, haga clic en Settings > Crawling > URL Entrypoints .
  2. En la URL Entrypoints página, en el Entrypoints campo, escriba una dirección URL por línea.
  3. (Opcional) En la Add Index Connector Configurations lista desplegable, seleccione un conector de índice que desee agregar como punto de entrada para la indexación.
    La lista desplegable solo está disponible si previamente ha agregado una o más definiciones de conector de índice.
    Consulte Añadir una definición de conector de índice.
  4. Haga clic Save Changes .
  5. (Opcional) Realice cualquiera de las siguientes acciones:

Acerca de las máscaras URL

Las máscaras URL son patrones que determinan qué documentos del sitio Web indexan o no los índices del robot de búsqueda.
Asegúrese de volver a generar el índice del sitio para que los resultados de las máscaras URL sean visibles para los clientes.
A continuación se indican dos tipos de máscaras URL que puede utilizar:
  • Incluir máscaras URL
  • Excluir máscaras URL
Las máscaras URL de inclusión indican al robot de búsqueda que indexe los documentos que coincidan con el patrón de la máscara.
Las máscaras de exclusión de URL indican al robot de búsqueda que indexe los documentos coincidentes.
A medida que el robot de búsqueda viaja de un vínculo a otro a través del sitio web, encuentra direcciones URL y busca máscaras que coincidan con esas direcciones URL. La primera coincidencia determina si se debe incluir o excluir esa dirección URL del índice. Si ninguna máscara coincide con una dirección URL encontrada, esa dirección URL se descarta del índice.
Las máscaras URL de inclusión para las direcciones URL de los puntos de entrada se generan automáticamente. Este comportamiento garantiza que todos los documentos encontrados en el sitio web se indiquen. También elimina convenientemente los enlaces que "dejan" tu sitio web. Por ejemplo, si una página indizada se vincula a https://www.yahoo.com, el robot de búsqueda no indexará esa dirección URL porque no coincide con la máscara de inclusión generada automáticamente por la dirección URL del punto de entrada.
Cada máscara de dirección URL que especifique debe estar en una línea independiente.
La máscara puede especificar cualquiera de las siguientes opciones:
  • Una ruta completa como en https://www.mydomain.com/products.html .
  • Una ruta parcial como en https://www.mydomain.com/products .
  • Dirección URL que utiliza comodines como en https://www.mydomain.com/*.html .
  • Una expresión normal (para usuarios avanzados).
    Para convertir una máscara en una expresión normal, inserte la palabra clave regexp entre el tipo de máscara ( exclude o include ) y la máscara de dirección URL.
A continuación se muestra un ejemplo sencillo de máscara de exclusión URL:
exclude https://www.mydomain.com/photos

Dado que este ejemplo es una máscara de URL de exclusión, no se indexará ningún documento que coincida con el patrón. El patrón coincide con cualquier elemento encontrado, tanto los archivos como las carpetas, de modo que https://www.mydomain.com/photos.html y https://www.mydomain.com/photos/index.html , que coinciden con la URL de exclusión, no se indizan. Para que solo coincidan los archivos de la /photos/ carpeta, la máscara URL debe contener una barra diagonal final, como en el ejemplo siguiente:
exclude https://www.mydomain.com/photos/

El siguiente ejemplo de máscara de exclusión utiliza comodines. Indica al robot de búsqueda que pase por alto los archivos con la extensión ".pdf". El robot de búsqueda no agrega estos archivos al índice.
exclude *.pdf

A continuación se muestra una simple máscara de URL de inclusión:
include https://www.mydomain.com/news/

Solo se indexan los documentos que están vinculados mediante una serie de vínculos desde un punto de entrada de URL o que se utilizan como puntos de entrada de URL. La enumeración única de la dirección URL de un documento como una máscara de URL de inclusión no indexa un documento no vinculado. Para agregar documentos no vinculados al índice, puede utilizar la función Puntos de entrada de URL.
Incluir máscaras y excluir máscaras puede funcionar conjuntamente. Puede excluir una gran parte del sitio web de la indexación mediante la creación de una máscara de URL de exclusión e incluir una o más de las páginas excluidas con una máscara de URL de inclusión. Por ejemplo, supongamos que la dirección URL del punto de entrada es la siguiente:
https://www.mydomain.com/photos/

El robot de búsqueda rastrea e indexa todas las páginas debajo /photos/summer/ , /photos/spring/ y /photos/fall/ (suponiendo que hay vínculos a al menos una página en cada directorio desde la photos carpeta). Este comportamiento se debe a que las rutas de vínculo permiten al robot de búsqueda encontrar los documentos en las carpetas /summer/ , /spring/ y /fall/ , y las direcciones URL de las carpetas coinciden con la máscara de inclusión que genera automáticamente la dirección URL del punto de entrada.
Puede elegir excluir todas las páginas de la /fall/ carpeta con una máscara de URL de exclusión, como en el ejemplo siguiente:
exclude https://www.mydomain.com/photos/fall/

O bien, incluya selectivamente solo /photos/fall/redleaves4.html como parte del índice con la siguiente máscara URL:
include https://www.mydomain.com/photos/fall/redleaves4.html

Para que los dos ejemplos de máscara anteriores funcionen correctamente, la máscara de inclusión aparece en primer lugar, como se muestra a continuación:
include https://www.mydomain.com/photos/fall/redleaves4.html 
exclude https://www.mydomain.com/photos/fall/

Dado que el robot de búsqueda sigue las direcciones en el orden en que aparecen, primero incluye /photos/fall/redleaves4.html y luego excluye el resto de los archivos de la /fall carpeta.
Si las instrucciones se especifican de la forma contraria a la siguiente:
exclude https://www.mydomain.com/photos/fall/ 
include https://www.mydomain.com/photos/fall/redleaves4.html

A continuación, no /photos/fall/redleaves4.html se incluye, aunque la máscara especifique que se incluye.
Una máscara URL que aparece primero siempre tiene prioridad sobre una máscara URL que aparece más adelante en la configuración de la máscara. Además, si el robot de búsqueda encuentra una página que coincide con una máscara URL de inclusión y una máscara URL de exclusión, la máscara que aparece primero siempre tiene prioridad.

Acerca del uso de palabras clave con máscaras URL

Puede calificar cada máscara de inclusión con una o más palabras clave separadas por espacio, lo que afecta la manera en que se indexan las páginas coincidentes.
Una coma no es válida como separador entre la máscara y la palabra clave; solo puede utilizar espacios.
Palabra clave
Descripción
noindex
Si no desea indexar el texto en las páginas que coinciden con la máscara de URL, pero desea seguir los vínculos de páginas coincidentes, agregue noindex después de la máscara de URL de inclusión. Asegúrese de separar la palabra clave de la máscara con un espacio como en el ejemplo siguiente:
include&nbsp;*.swf&nbsp;noindex
El ejemplo anterior especifica que el robot de búsqueda sigue todos los vínculos de archivos con la extensión, pero deshabilita la indexación de todo el texto contenido en esos archivos. .swf
La noindex palabra clave equivale a una etiqueta meta de robot con content="noindex" entre las <head>...</head> etiquetas de las páginas coincidentes.
noseguir
Si desea indexar el texto en las páginas que coinciden con la máscara de dirección URL, pero no desea seguir los vínculos de la página coincidentes, agregue nofollow después de la máscara de dirección URL de inclusión. Asegúrese de separar la palabra clave de la máscara con un espacio como en el ejemplo siguiente:
include&nbsp;https://www.mydomain.com/photos&nbsp;nofollow
La nofollow palabra clave equivale a una etiqueta meta de robot con content="nofollow" entre las <head>...</head> etiquetas de las páginas coincidentes.
regexp
Se utiliza para incluir y excluir máscaras.
Cualquier máscara de URL precedida de regexp se trata como una expresión normal. Si el robot de búsqueda encuentra documentos que coinciden con una máscara de URL de expresión normal de exclusión, esos documentos no se indizan. Si el robot de búsqueda encuentra documentos que coinciden con una máscara de URL de expresión normal y la incluye, esos documentos se indexan. Por ejemplo, supongamos que tiene la siguiente máscara URL:
exclude&nbsp;regexp&nbsp;^.*/products/.*\.html$
El robot de búsqueda excluye los archivos coincidentes, como https://www.mydomain.com/products/page1.html
Si tenía la siguiente máscara de exclusión de URL de expresión normal:
exclude&nbsp;regexp&nbsp;^.*\?..*$
El robot de búsqueda no incluye ninguna dirección URL que contenga un parámetro CGI como https://www.mydomain.com/cgi/prog/?arg1=val1&arg2=val2 .
Si tiene lo siguiente, incluya la máscara de URL de expresión normal:
include&nbsp;regexp&nbsp;^.*\.swf$&nbsp;noindex
El robot de búsqueda sigue todos los vínculos de archivos con la extensión ".swf". La noindex palabra clave también especifica que el texto de los archivos coincidentes no se indiza.

Añadir máscaras URL para indexar o no partes del sitio web

Puede utilizar URL Masks para definir qué partes del sitio Web desea o no desea rastrear e indexar.
Utilice el campo Probar máscaras URL para comprobar si un documento se incluye o no después de indexar.
Asegúrese de volver a generar el índice del sitio para que los resultados de las máscaras URL sean visibles para los clientes.
Adición de máscaras URL para indexar o no partes del sitio web
  1. En el menú de producto, haga clic en Settings > Crawling > URL Masks .
  2. (Opcional) En la URL Masks página, en el Test URL Masks campo, introduzca una máscara de URL de prueba en el sitio web y, a continuación, haga clic en Test .
  3. En el URL Masks campo, escriba include (para agregar un sitio web que desee rastrear e indexar) o exclude (para bloquear un sitio web para que no se pueda rastrear ni indizar), seguido de la dirección de máscara URL.
    Introduzca una dirección de máscara URL por línea. Ejemplo:
    include https://www.mycompany.com/summer 
    include https://www.mycompany.com/spring 
    exclude regexp .*\.xml 
    exclude https://www.mycompany.com/fall
    
    
  4. Haga clic Save Changes .
  5. (Opcional) Realice cualquiera de las siguientes acciones:

Acerca de las máscaras de fecha

Puede utilizar Máscaras de fecha para incluir o excluir archivos de los resultados de búsqueda según la edad del archivo.
Asegúrese de volver a generar el índice del sitio para que los resultados de las máscaras URL sean visibles para los clientes.
A continuación se indican dos tipos de máscaras de fecha que puede utilizar:
  • Incluir máscaras de fecha ("días de inclusión" e "fecha de inclusión")
    Incluya los archivos de índice de máscaras de fecha con fecha anterior a la fecha especificada.
  • Excluir máscaras de fecha ("días de exclusión" y "fecha de exclusión")
    Excluir los archivos de índice de máscaras de fecha con fecha anterior a la fecha especificada.
De forma predeterminada, la fecha del archivo se determina a partir de la información de la etiqueta meta. Si no se encuentra ninguna etiqueta Meta, la fecha de un archivo se determina a partir del encabezado HTTP que se recibe del servidor cuando el robot de búsqueda descarga un archivo.
Cada máscara de fecha que especifique debe estar en una línea separada.
La máscara puede especificar cualquiera de las siguientes opciones:
  • Una ruta completa como en https://www.mydomain.com/products.html
  • Una ruta parcial como en https://www.mydomain.com/products
  • Dirección URL que utiliza comodines https://www.mydomain.com/*.html
  • Una expresión regular. Para convertir una máscara en una expresión normal, inserte la palabra clave regexp antes de la dirección URL.
Las máscaras de fecha de inclusión y exclusión pueden especificar una fecha de una de las dos formas siguientes. Las máscaras solo se aplican si los archivos coincidentes se crearon en la fecha especificada o antes de ella:
  1. Varios días. Por ejemplo, supongamos que la máscara de fecha es la siguiente:
    exclude-days 30 https://www.mydomain.com/docs/archive/)
    
    
    El número de días especificados se vuelve a contabilizar. Si el archivo tiene fecha en la fecha de llegada o antes, se aplica la máscara.
  2. Fecha real con el formato AAAA-MM-DD. Por ejemplo, supongamos que la máscara de fecha es la siguiente:
    include-date 2011-02-15 https://www.mydomain.com/docs/archive/)
    
    
    Si el documento coincidente está fechado en la fecha especificada o antes, se aplica la máscara de fecha.
A continuación se muestra un ejemplo sencillo de máscara de fecha de exclusión:
exclude-days 90 https://www.mydomain.com/docs/archive

Dado que se trata de una máscara de fecha de exclusión, cualquier archivo que coincida con el patrón no se indexará y tendrá 90 días de antigüedad o más. Cuando se excluye un documento, no se indiza ningún texto y no se siguen vínculos de ese archivo. El archivo se ignora de forma efectiva. En este ejemplo, los archivos y las carpetas pueden coincidir con el patrón de URL especificado. Observe que tanto https://www.mydomain.com/docs/archive.html como https://www.mydomain.com/docs/archive/index.html coinciden con el patrón y no se indexan si tienen 90 días o más. Para que solo coincidan los archivos de la /docs/archive/ carpeta, la máscara de fecha debe contener una barra diagonal final, como se muestra a continuación:
exclude-days 90 https://www.mydomain.com/docs/archive/

Las máscaras de fecha también se pueden utilizar con comodines. La siguiente máscara de exclusión indica al robot de búsqueda que pase por alto los archivos con la extensión ".pdf" con fecha de 2011-02-15 o anterior. El robot de búsqueda no agrega ningún archivo coincidente al índice.
exclude-date 2011-02-15 *.pdf

Incluir máscara de fecha tiene un aspecto similar, solo se agregan al índice los archivos coincidentes. El siguiente ejemplo de máscara de fecha indica al robot de búsqueda que indexe el texto de cualquier archivo que tenga cero días o más en el /docs/archive/manual/ área del sitio web.
include-days 0 https://www.mydomain.com/docs/archive/manual/

Incluir máscaras y excluir máscaras puede funcionar conjuntamente. Por ejemplo, puede excluir una gran parte del sitio web de la indexación mediante la creación de una máscara de fecha de exclusión e incluir una o más de las páginas excluidas con una máscara de URL de inclusión. Si la dirección URL del punto de entrada es la siguiente:
https://www.mydomain.com/archive/

El robot de búsqueda rastrea e indexa todas las páginas debajo /archive/summer/ , /archive/spring/ y /archive/fall/ (suponiendo que hay vínculos a al menos una página en cada carpeta desde la archive carpeta). Este comportamiento se debe a que las rutas de vínculo permiten al robot de búsqueda "buscar" los archivos de las carpetas /summer/ , /spring/ y /fall/ y las direcciones URL de las carpetas coinciden con la máscara de inclusión generada automáticamente por la dirección URL del punto de entrada.
Puede elegir excluir todas las páginas con más de 90 días de antigüedad en la /fall/ carpeta con una máscara de fecha de exclusión, como se muestra a continuación:
exclude-days 90 https://www.mydomain.com/archive/fall/

Solo puede incluir de forma selectiva /archive/fall/index.html (independientemente de su antigüedad (se iguala cualquier archivo de 0 días o más) como parte del índice con la siguiente máscara de fecha:
include-days 0 https://www.mydomain.com/archive/fall/index.html

Para que los dos ejemplos de máscara anteriores funcionen correctamente, debe aplicar la lista de la máscara de inclusión primero como en el siguiente ejemplo:
include-days 0 https://www.mydomain.com/archive/fall/index.html 
exclude-days 90 https://www.mydomain.com/archive/fall/

Dado que el robot de búsqueda sigue las direcciones en el orden en que se especifican, primero incluye /archive/fall/index.html y luego excluye el resto de los archivos de la /fall carpeta.
Si las instrucciones se especifican de la forma contraria a la siguiente:
exclude-days 90 https://www.mydomain.com/archive/fall/ 
include-days 0 https://www.mydomain.com/archive/fall/index.html 

A continuación no /archive/fall/index.html se incluye, aunque la máscara especifique que debe estar. Una máscara de fecha que aparece primero siempre tiene prioridad sobre una máscara de fecha que puede aparecer más adelante en la configuración de la máscara. Además, si el robot de búsqueda encuentra una página que coincide tanto con una máscara de fecha de inclusión como con una máscara de fecha de exclusión, la máscara que aparece primero siempre tiene prioridad.

Acerca del uso de palabras clave con máscaras de fecha

Puede calificar cada máscara de inclusión con una o más palabras clave separadas por espacio, lo que afecta la manera en que se indexan las páginas coincidentes.
Una coma no es válida como separador entre la máscara y la palabra clave; solo puede utilizar espacios.
Palabra clave
Descripción
noindex
Si no desea indexar el texto en las páginas con fecha en la fecha especificada por la máscara de inclusión o antes de ella, agregue noindex después de la máscara de fecha de inclusión como se muestra a continuación:
include-days&nbsp;10&nbsp;*.swf&nbsp;noindex
Asegúrese de separar la palabra clave de la máscara con un espacio.
El ejemplo anterior especifica que el robot de búsqueda sigue todos los vínculos de archivos con la extensión ".swf" que tienen 10 días o más. Sin embargo, deshabilita la indexación de todo el texto contenido en esos archivos.
Es posible que desee asegurarse de que el texto de los archivos antiguos no está indizado pero siga todos los vínculos de esos archivos. En estos casos, utilice una máscara de fecha de inclusión con la palabra clave "noindex" en lugar de utilizar una máscara de fecha de exclusión.
noseguir
Si desea indexar el texto en las páginas con fecha en o antes de la fecha especificada por la máscara de inclusión, pero no desea seguir los vínculos de la página coincidente, agregue nofollow después de la máscara de fecha de inclusión como se muestra a continuación:
include-days&nbsp;8&nbsp;https://www.mydomain.com/photos&nbsp;nofollow
Asegúrese de separar la palabra clave de la máscara con un espacio.
La nofollow palabra clave es equivalente a una etiqueta meta de robot con content="nofollow" entre la <head>...</head> etiqueta de las páginas coincidentes.
server-date
Se utiliza para incluir y excluir máscaras.
El robot de búsqueda generalmente descarga y analiza cada archivo antes de comprobar las máscaras de fecha. Este comportamiento se produce porque algunos tipos de archivo pueden especificar una fecha dentro del propio archivo. Por ejemplo, un documento HTML puede incluir metaetiquetas que definan la fecha del archivo.
Si va a excluir muchos archivos en función de su fecha y no desea cargar innecesariamente los servidores, puede usar server-date después de la dirección URL en la máscara de fecha.
Esta palabra clave indica al robot de búsqueda que confíe en la fecha del archivo que devuelve el servidor en lugar de analizar cada archivo. Por ejemplo, la siguiente máscara de fecha de exclusión omite las páginas que coinciden con la dirección URL si los documentos son 90 días o más, según la fecha devuelta por el servidor en los encabezados HTTP:
exclude-days&nbsp;90&nbsp;https://www.mydomain.com/docs/archive&nbsp;server-date
Si la fecha devuelta por el servidor es 90 días o más, server-date especifica que los documentos excluidos no se descargarán del servidor. El resultado significa un tiempo de indexación más rápido para los documentos y una carga reducida en los servidores. Si no server-date se especifica, el robot de búsqueda omite la fecha devuelta por el servidor en los encabezados HTTP. En su lugar, se descarga y comprueba cada archivo para ver si se ha especificado la fecha. Si no se especifica ninguna fecha en el archivo, el robot de búsqueda utiliza la fecha que devuelve el servidor.
No debe utilizar server-date si los archivos contienen comandos que anulan la fecha del servidor.
regexp
Se utiliza para incluir y excluir máscaras.
Cualquier máscara de fecha precedida por regexp se trata como una expresión normal.
Si el robot de búsqueda encuentra archivos que coinciden con una máscara de fecha de expresión normal de exclusión, no los indexará.
Si el robot de búsqueda encuentra archivos que coinciden y incluyen una máscara de fecha de expresión normal, indexará esos documentos.
Por ejemplo, supongamos que tiene la siguiente máscara de fecha:
exclude-days&nbsp;180&nbsp;regexp&nbsp;.*archive.*
La máscara indica al robot de búsqueda que excluya los archivos coincidentes que tengan 180 días o más. Es decir, los archivos que contienen la palabra "archivo" en su dirección URL.

Añadir máscaras de fecha para indexar o no partes del sitio web

Puede utilizar Máscaras de fecha para incluir o excluir archivos de los resultados de búsqueda de clientes en función de la edad de los archivos.
Utilice los campos Test Date y Test URL para comprobar si un archivo se incluye o no después de indexarlo.
Asegúrese de volver a generar el índice del sitio para que los resultados de las máscaras URL sean visibles para los clientes.
Adición de máscaras de fecha para indexar o no partes del sitio web
  1. En el menú de producto, haga clic en Settings > Crawling > Date Masks .
  2. (Opcional) En la Date Masks página, en el Test Date campo, introduzca una fecha con el formato AAAA-MM-DD (por ejemplo, 2011-07-25 ); en el Test URL campo, introduzca una máscara URL del sitio web y, a continuación, haga clic en Test .
  3. En el Date Masks campo, introduzca una dirección de máscara de fecha por línea.
  4. Haga clic Save Changes .
  5. (Opcional) Realice cualquiera de las siguientes acciones:

Acerca de las contraseñas

Para acceder a partes del sitio web protegidas con autenticación básica HTTP, puede agregar una o más contraseñas.
Antes de que los clientes vean los efectos de la configuración de contraseña, debe volver a generar el índice del sitio.
En la Passwords página, escriba cada contraseña en una sola línea. La contraseña consiste en una dirección URL o territorio, un nombre de usuario y una contraseña, como en el siguiente ejemplo:
https://www.mydomain.com/ myname mypassword

En lugar de usar una ruta de URL, como la anterior, también puede especificar un territorio.
Para determinar el dominio correcto que se debe utilizar, abra una página web protegida por contraseña con un navegador y vea el cuadro de diálogo "Introducir contraseña de red".
El nombre del territorio, en este caso, es "Mi territorio del sitio".
Con el nombre del dominio anterior, la contraseña podría tener el siguiente aspecto:
My Site Realm myusername mypassword

Si el sitio Web tiene varios dominios, puede crear varias contraseñas introduciendo un nombre de usuario y una contraseña para cada dominio en una línea separada, como en el siguiente ejemplo:
Realm1 name1 password1 
Realm2 name2 password2 
Realm3 name3 password3

Puede combinar contraseñas que contengan direcciones URL o dominios para que la lista de contraseñas tenga el siguiente aspecto:
Realm1 name1 password1 
https://www.mysite.com/path1/path2 name2 password2 
Realm3 name3 password3 
Realm4 name4 password4 
https://www.mysite.com/path1/path5 name5 password5 
https://www.mysite.com/path6 name6 password6

En la lista anterior, se utiliza la primera contraseña que contiene un dominio o una dirección URL que coincide con la solicitud de autenticación del servidor. Incluso si el archivo de https://www.mysite.com/path1/path2/index.html se encuentra en Realm3 , por ejemplo, name2 y password2 se utiliza porque la contraseña definida con la dirección URL se muestra por encima de la definida con el dominio.

Añadir contraseñas para acceder a áreas del sitio web que requieren autenticación

Puede utilizar contraseñas para acceder a las áreas del sitio web protegidas por contraseña con fines de rastreo e indexación.
Antes de que los efectos de la contraseña sean visibles para los clientes, asegúrese de volver a generar el índice del sitio
Para agregar contraseñas para acceder a áreas del sitio web que requieren autenticación
  1. En el menú de producto, haga clic en Settings > Crawling > Passwords .
  2. En la Passwords página, en el Passwords campo, introduzca un territorio o una dirección URL, su nombre de usuario y contraseña asociados, separados por un espacio.
    Ejemplo de contraseña de territorio y contraseña de URL en líneas separadas:
    Realm1 name1 password1 
    https://www.mysite.com/path1/path2 name2 password2
    
    
    Solo agregue una contraseña por línea.
  3. Haga clic Save Changes .
  4. (Opcional) Realice cualquiera de las siguientes acciones:

Acerca de los tipos de contenido

Puede utilizar Content Types para seleccionar qué tipos de archivos desea rastrear e indexar para esta cuenta.
Los tipos de contenido que puede elegir rastrear e indexar incluyen documentos PDF, documentos de texto, películas de Flash de Adobe, archivos de aplicaciones de Microsoft Office como Word, Excel y Powerpoint, y texto en archivos MP3. El texto que se encuentra dentro de los tipos de contenido seleccionados se busca junto con el resto del texto del sitio web.
Antes de que los clientes vean los efectos de la configuración de tipos de contenido, debe volver a generar el índice del sitio.

Acerca de la indexación de archivos de música MP3

Si selecciona la opción Text in MP3 Music Files en la Content Types página, se rastrea y se indexa un archivo MP3 de una de las dos maneras siguientes. La primera y más común es desde una etiqueta href delimitadora en un archivo HTML, como se muestra a continuación:
<a href="MP3-file-URL"></a>

La segunda forma es introducir la URL del archivo MP3 como punto de entrada de URL.
Un archivo MP3 está reconocido por su tipo MIME "audio/mpeg".
Tenga en cuenta que los tamaños de archivo de música MP3 pueden ser bastante grandes, aunque normalmente contienen sólo una pequeña cantidad de texto. Por ejemplo, los archivos MP3 pueden almacenar de forma opcional el nombre del álbum, el nombre del artista, el título de la canción, el género de la canción, el año de lanzamiento y un comentario. Esta información se almacena al final del archivo en lo que se denomina TAG. Los archivos MP3 que contienen información de TAG se indizan de la siguiente manera:
  • El título de la canción se trata como el título de una página HTML.
  • El comentario se trata como una descripción definida para una página HTML.
  • El género se trata como una palabra clave definida para una página HTML.
  • El nombre del artista, el nombre del álbum y el año de publicación se tratan como el cuerpo de una página HTML.
Tenga en cuenta que cada archivo MP3 rastreado e indexado en el sitio web cuenta como una página.
Si su sitio web contiene muchos archivos MP3 de gran tamaño, puede superar el límite de bytes de indexación de su cuenta. Si esto sucede, puede anular la selección Text in MP3 Music Files en la Content Types página para evitar la indexación de todos los archivos MP3 del sitio web.
Si solo desea evitar la indexación de determinados archivos MP3 en su sitio web, puede realizar una de las siguientes acciones:
  • Rodee las etiquetas delimitadoras que se vinculan a los archivos MP3 con <nofollow> y </nofollow> etiquetas. El robot de búsqueda no sigue los vínculos entre esas etiquetas.
  • Añada las direcciones URL de los archivos MP3 como máscaras de exclusión.

Selección de tipos de contenido para rastrear e indexar

Puede utilizar Content Types para seleccionar qué tipos de archivos desea rastrear e indexar para esta cuenta.
Los tipos de contenido que puede elegir rastrear e indexar incluyen documentos PDF, documentos de texto, películas de Flash de Adobe, archivos de aplicaciones de Microsoft Office como Word, Excel y Powerpoint, y texto en archivos MP3. El texto que se encuentra dentro de los tipos de contenido seleccionados se busca junto con el resto del texto del sitio web.
Antes de que los clientes vean los efectos de la configuración de tipos de contenido, debe volver a generar el índice del sitio.
Para rastrear e indexar archivos MP3 chinos, japoneses o coreanos, complete los pasos a continuación. A continuación, en Settings > Metadata > Injections , especifique el conjunto de caracteres utilizado para codificar los archivos MP3.
Seleccionar tipos de contenido para rastrear e indexar
  1. En el menú de producto, haga clic en Settings > Crawling > Content Types .
  2. En la Content Types página, compruebe los tipos de archivo que desea rastrear e indexar en el sitio web.
  3. Haga clic Save Changes .
  4. (Opcional) Realice cualquiera de las siguientes acciones:

Acerca de las conexiones

Puede utilizar Conexiones para agregar hasta diez conexiones HTTP que el robot de búsqueda utiliza para indexar el sitio Web.
Aumentar el número de conexiones puede reducir significativamente la cantidad de tiempo que se tarda en completar un rastreo y un índice. Sin embargo, tenga en cuenta que cada conexión adicional aumenta la carga en el servidor.

Añadir conexiones para aumentar la velocidad de indexación

Puede reducir la cantidad de tiempo que tarda en indexar el sitio web mediante Conexiones para aumentar el número de conexiones HTTP simultáneas que utiliza el explorador. Puede agregar hasta diez conexiones.
Tenga en cuenta que cada conexión adicional aumenta la carga que se coloca en el servidor.
Agregar conexiones para aumentar la velocidad de indexación
  1. En el menú de producto, haga clic en Settings > Crawling > Connections .
  2. En la Parallel Indexing Connections página, en el Number of Connections campo, introduzca el número de conexiones (1-10) que desea agregar.
  3. Haga clic Save Changes .
  4. (Opcional) Realice cualquiera de las siguientes acciones:

Acerca del envío del formulario

Puede utilizar el envío de formulario para ayudarle a reconocer y procesar formularios en el sitio web.
Durante el rastreo y la indexación del sitio web, cada formulario encontrado se compara con las definiciones de formulario que ha agregado. Si un formulario coincide con una definición de formulario, se envía para indexación. Si un formulario coincide con más de una definición, el formulario se envía una vez por cada definición coincidente.

Añadir definiciones de formulario para indexar formularios en el sitio web

Se puede utilizar Form Submission para ayudar a procesar formularios reconocidos en el sitio web con fines de indexación.
Asegúrese de volver a generar el índice del sitio para que los resultados de los cambios sean visibles para los clientes.
Adición de definiciones de formularios para indexar formularios en el sitio Web
  1. En el menú de producto, haga clic en Settings > Crawling > Form Submission .
  2. En la Form Submission página, haga clic en Add New Form .
  3. En la Add Form Definition página, establezca las opciones Form Recognition y Form Submission .
    Las cinco opciones de la Form Recognition sección de la Form Definition página se utilizan para identificar los formularios de las páginas Web que se pueden procesar.
    Las tres opciones de la Form Submission sección se utilizan para especificar los parámetros y valores que se envían con un formulario al servidor web.
    Introduzca un parámetro de reconocimiento o envío por línea. Cada parámetro debe incluir un nombre y un valor.
    Opción
    Descripción
    Reconocimiento de formularios
    Máscara de dirección URL de página
    Identifique la página web o las páginas que contienen el formulario. Para identificar un formulario que aparece en una sola página, introduzca la dirección URL de esa página como en el ejemplo siguiente:
    https://www.mydomain.com/login.html
    Para identificar los formularios que aparecen en varias páginas, especifique una máscara URL que utilice caracteres comodín para describir las páginas. Para identificar los formularios encontrados en cualquier página ASP en https://www.mydomain.com/register/ , por ejemplo, debe especificar lo siguiente:
    https://www.mydomain.com/register/*.asp&nbsp;
    También puede utilizar una expresión normal para identificar varias páginas. Especifique la regexp palabra clave antes de la máscara de dirección URL, como en el ejemplo siguiente:
    regexp&nbsp;^https://www\.mydomain\.com/.*/login\.html$
    Máscara de dirección URL de acción
    Identifica el atributo de acción de la <form> etiqueta .
    Al igual que la máscara de dirección URL de la página, la máscara de dirección URL de acción puede adoptar la forma de una sola dirección URL, una URL con caracteres comodín o una expresión normal.
    La máscara URL puede ser cualquiera de las siguientes:
    • Una ruta completa como la siguiente: https://www.mydomain.com/products.html
    • Una ruta parcial como en el siguiente ejemplo: https://www.mydomain.com/products
    • Dirección URL que utiliza comodines como se muestra a continuación: https://www.mydomain.com/*.html
    • Una expresión regular como la siguiente: regexp&nbsp^https://www\.mydomain\.com/.*/login\.html$
    Si no desea indexar el texto en las páginas identificadas por una máscara de dirección URL o por una máscara de dirección URL de acción, o si no desea que se sigan vínculos en esas páginas, puede utilizar las palabras clave noindex y nofollow . Puede agregar estas palabras clave a sus máscaras mediante máscaras URL o puntos de entrada.
    Máscara de nombre de formulario
    Identifica los formularios si las <form> etiquetas de las páginas web contienen un atributo de nombre.
    Puede utilizar un nombre simple ( login_form ), un nombre con un comodín ( form* ) o una expresión normal ( regexp ^.*authorize.*$ ).
    Normalmente, este campo se puede dejar vacío porque los formularios normalmente no tienen un atributo de nombre.
    Máscara de ID de formulario
    Identifica los formularios si las <form> etiquetas de las páginas web contienen un atributo de identificación.
    Puede utilizar un nombre simple ( login_form ), un nombre con un comodín ( form* ) o una expresión normal ( regexp ^.*authorize.*$ ).
    Normalmente, este campo se puede dejar vacío porque los formularios normalmente no tienen un atributo de nombre.
    Parámetros
    Identifique los formularios que contienen o no contienen un parámetro con nombre o un parámetro con nombre con un valor específico.
    Por ejemplo, para identificar un formulario que contiene un parámetro de correo electrónico preestablecido en rick_brough@mydomain.com, un parámetro de contraseña, pero no un parámetro de nombre, debe especificar la siguiente configuración de parámetro, una por línea:
    email=rick_brough@mydomain.com password not first-name
    Envío de formulario
    Anular URL de acción
    Especifique cuándo el destinatario del envío del formulario es diferente del especificado en el atributo de acción del formulario.
    Por ejemplo, puede utilizar esta opción cuando el formulario se envía mediante una función de JavaScript que construye un valor de URL diferente del que se encuentra en el formulario.
    Override (método)
    Especifique cuándo el destinatario del envío del formulario es diferente del que se utiliza en el atributo de acción del formulario y cuándo el JavaScript que envía ha cambiado el método.
    Los valores predeterminados para todos los parámetros de formulario ( <input> etiquetas, incluidos los campos ocultos), el valor predeterminado <option> de una <select> etiqueta y el texto predeterminado entre <textarea>...</textarea> etiquetas) se leen en la página web. Sin embargo, cualquier parámetro que aparezca en la sección Envío del formulario , en el campo Parámetros , se reemplazará por los valores predeterminados del formulario.
    Parámetros
    Puede añadir un prefijo a los parámetros de envío de formulario con la not palabra clave.
    Al anteponer un parámetro con not , no se envía como parte del envío del formulario. Este comportamiento resulta útil para las casillas de verificación que se deben enviar sin seleccionar.
    Por ejemplo, supongamos que desea enviar los siguientes parámetros:
    • El parámetro de correo electrónico con el valor nobody@mydomain.com
    • El parámetro password con el valor tryme
    • El parámetro mychecktal como no está seleccionado.
    • Todos los demás <form> parámetros como sus valores predeterminados
    El parámetro de envío de formulario tendría el siguiente aspecto:
    email=nobody@mydomain.com password=tryme not mycheckbox
    El atributo de método de la <form> etiqueta en la página web se utiliza para decidir si los datos se envían al servidor mediante el método GET o el método POST.
    Si la <form> etiqueta no contiene un atributo de método, el formulario se envía mediante el método de GET.
  4. Haga clic Add .
  5. (Opcional) Realice cualquiera de las siguientes acciones:

Edición de una definición de formulario

Puede editar una definición de formulario existente si ha cambiado un formulario en el sitio Web o si sólo necesita cambiar la definición.
Tenga en cuenta que no hay ninguna History característica en la Form Submission página para revertir los cambios que realice en la definición del formulario.
Asegúrese de volver a generar el índice del sitio para que los resultados de los cambios sean visibles para los clientes.
Para editar una definición de formulario
  1. En el menú de producto, haga clic en Settings > Crawling > Form Submission .
  2. En la Form Submission página, haga clic Edit a la derecha de la definición de formulario que desee actualizar.
  3. En la Edit Form Definition página, establezca las opciones Form Recognition y Form Submission .
  4. Haga clic Save Changes .
  5. (Opcional) Realice cualquiera de las siguientes acciones:

Eliminación de una definición de formulario

Puede eliminar una definición de formulario existente si el formulario ya no existe en el sitio Web o si ya no desea procesar e indexar un formulario concreto.
Tenga en cuenta que no hay ninguna History característica en la Form Submission página para revertir los cambios que realice en la definición del formulario.
Asegúrese de volver a generar el índice del sitio para que los resultados de los cambios sean visibles para los clientes.
Eliminar una definición de formulario
  1. En el menú de producto, haga clic en Settings > Crawling > Form Submission .
  2. En la Form Submission página, haga clic Delete a la derecha de la definición de formulario que desee eliminar.
    Asegúrese de elegir la definición de formulario correcta que desea eliminar. No hay ningún cuadro de diálogo de confirmación de eliminación cuando hace clic Delete en el paso siguiente.
  3. En la Delete Form Definition página, haga clic en Delete .
  4. (Opcional) Realice cualquiera de las siguientes acciones:

Acerca del conector de índice

Se utiliza Index Connector para definir fuentes de entrada adicionales para indexar páginas XML o cualquier tipo de fuente.
Puede utilizar un origen de entrada de fuente de datos para acceder al contenido almacenado en un formulario distinto del que se suele descubrir en un sitio web mediante uno de los métodos de rastreo disponibles. Cada documento rastreado e indexado corresponde directamente a una página de contenido del sitio web. Sin embargo, una fuente de datos proviene de un documento XML o de un archivo de texto delimitado por comas o tabuladores, y contiene la información de contenido que se va a indexar.
Un origen de datos XML consta de estatutos o registros XML que contienen información que corresponde a documentos individuales. Estos documentos individuales se agregan al índice. Una fuente de datos de texto contiene registros individuales delimitados por líneas que corresponden a documentos individuales. Estos documentos individuales también se agregan al índice. En cualquier caso, una configuración de conector de índice describe cómo interpretar la fuente. Cada configuración describe dónde reside el archivo y cómo los servidores acceden a él. La configuración también describe la información de "asignación". Es decir, cómo se utilizan los elementos de cada registro para rellenar los campos de metadatos en el índice resultante.
Después de agregar una definición de conector de índice a la Staged Index Connector Definitions página, puede cambiar cualquier configuración, excepto los valores Nombre o Tipo.
La Index Connector página muestra la siguiente información:
  • Nombre de los conectores de índice definidos que ha configurado y agregado.
  • Uno de los siguientes tipos de fuentes de datos para cada conector que ha agregado:
    • Texto : archivos sencillos "planos", delimitados por comas, delimitados por tabuladores u otros formatos delimitados de forma consistente.
    • Fuente : fuentes XML.
    • XML : colecciones de documentos XML.
  • Indica si el conector está activado o no para el siguiente rastreo e indización realizado.
  • La dirección del origen de datos.

Cómo funciona el proceso de indexación para las configuraciones de texto y fuente en el conector de índice

Paso
Proceso
Descripción
1
Descargue la fuente de datos.
Para las configuraciones de texto y fuente, es una descarga de archivo sencilla.
2
Desglose el origen de datos descargado en pseudodocumentos individuales.
Para Texto , cada nueva línea de texto delimitada por líneas corresponde a un documento individual y se analiza utilizando el delimitador especificado, como una coma o una tabulación.
Para Feed , los datos de cada documento se extraen usando un patrón de expresión regular en el siguiente formulario:
<${Itemtag}>(.*?)</${Itemtag}>
Mediante Asignar en la página Conector de índice Añadir , cree una copia en caché de los datos y, a continuación, cree una lista de vínculos para el buscador. Los datos se almacenan en una caché local y se rellenan con los campos configurados.
Los datos analizados se escriben en la caché local.
Esta caché se lee más tarde para crear los documentos HTML simples que necesita el rastreador. Por ejemplo,
<html><head> <title>{title}</title> <meta name="{field}" content="{data}" /> ... </head><body> {body} </body></html>
El elemento <title> solo se genera cuando existe una asignación al campo de metadatos Título. Del mismo modo, el elemento <body> solo se genera cuando existe una asignación al campo de metadatos Body.
Importante : No se admite la asignación de valores a la etiqueta meta de URL predefinida.
Para todas las demás asignaciones, se generan <meta> etiquetas para cada campo que tenga datos encontrados en el documento original.
Los campos de cada documento se agregan a la caché. Para cada documento que se escribe en la caché, también se genera un vínculo como en los siguientes ejemplos:
<a href="index:Adobe?key=<primary key field>\" /> <a href="index:Adobe?key=<primary key field>\" /> ....
La asignación de la configuración debe tener un campo identificado como Clave principal. Esta asignación forma la clave que se utiliza cuando se recuperan datos de la caché.
El buscador reconoce el índice de URL: prefijo de esquema, que luego puede acceder a los datos almacenados en la caché local.
3
Arrastre el conjunto de documentos en caché.
El índice: los vínculos se agregan a la lista pendiente del rastreador y se procesan en la secuencia de rastreo normal.
4
Procese cada documento.
El valor clave de cada vínculo corresponde a una entrada de la caché, por lo que al rastrear cada vínculo se obtienen los datos de ese documento de la caché. Luego se "integra" en una imagen HTML que se procesa y se agrega al índice.

Cómo funciona el proceso de indexación para las configuraciones XML en el conector de índice

El proceso de indexación para la configuración XML es similar al proceso para las configuraciones de texto y fuente con los siguientes cambios y excepciones menores.
Dado que los documentos para los rastreos XML ya están separados en archivos individuales, los pasos 1 y 2 de la tabla anterior no se aplican directamente. Si especifica una dirección URL en los campos Host Address y File Path de la Index Connector Add página, se descargará y se procesará como un documento HTML normal. Se espera que el documento de descarga contenga una colección de <a href="{url}"... vínculos, cada uno de los cuales apunta a un documento XML que se procesa. Estos vínculos se convierten al siguiente formulario:
<a href="index:<ic_config_name>?url="{url}">

Por ejemplo, si la configuración de Adobe devolvió los vínculos siguientes:
<a href="https://www.adobe.com/somepath/doc1.xml">doc 1</a> 
<a href="https://www.adobe.com/otherpath/doc2.xml">doc 2</a>

En la tabla anterior, el paso 3 no se aplica y el paso 4 se completa en el momento del rastreo y la indexación.
También puede mezclar sus documentos XML con otros documentos que se descubrieron de forma natural a través del proceso de rastreo. En estos casos, se pueden usar reglas de reescritura ( Settings > Rewrite Rules > Crawl List Retrieve URL Rules ) para cambiar las direcciones URL de los documentos XML y dirigirlos al conector de índice.
Por ejemplo, se supone que tiene la siguiente regla de reescritura:
RewriteRule (^http.*[.]xml$) index:Adobe?key=$1

Esta regla traduce cualquier dirección URL que termine con .xml en un vínculo Conector de índice. El buscador reconoce y vuelve a escribir el esquema de index: URL. El proceso de descarga se redirige a través del servidor Apache Index Connector en el servidor primario. Cada documento descargado se examina utilizando el mismo patrón de expresión regular que se utiliza con las fuentes. En este caso, sin embargo, el documento HTML fabricado no se guarda en la caché. En su lugar, se entrega directamente al buscador para el procesamiento del índice.

Cómo configurar varios conectores de índice

Puede definir varias configuraciones de conector de índice para cualquier cuenta. Las configuraciones se agregan automáticamente a la lista desplegable en Settings > Crawl > URL Entrypoints , como se muestra en la siguiente ilustración:
Al seleccionar una configuración en la lista desplegable, se agrega el valor al final de la lista de los puntos de entrada de URL.
Aunque las configuraciones del conector de índice desactivadas se agregan a la lista desplegable, no puede seleccionarlas. Si selecciona la misma configuración del conector de índice por segunda vez, se agrega al final de la lista y se elimina la instancia anterior.
Para especificar un punto de entrada de conector de índice para un rastreo incremental, puede agregar entradas con el siguiente formato:
index:<indexconnector_configuration_name>

El buscador procesa cada entrada agregada si se encuentra en la página Conectores de índice y está activada.
Nota: Dado que la dirección URL de cada documento se crea utilizando el nombre de configuración del conector de índice y la clave principal del documento, asegúrese de utilizar el mismo nombre de configuración del conector de índice al realizar actualizaciones incrementales. Al hacerlo, se pueden Adobe Search&Promote actualizar correctamente los documentos indexados anteriormente.
Consulte también Acerca de los puntos de entrada de URL.
Uso de mapas de configuración al agregar un conector de índice
Cuando se agrega un conector de índice, se puede utilizar la función Setup Maps para descargar una muestra del origen de datos. Los datos se examinan para determinar la idoneidad de la indexación.
Si ha seleccionado el tipo Conector de índice...
La función de mapas de configuración...
Texto
Determina el valor del delimitador probando las fichas primero y luego las barras verticales ( | ), y finalmente comas ( , ). Si ya especificó un valor delimitador antes de hacer clic en Configurar mapas , se utilizará ese valor.
El mejor ajuste resulta en que los campos de mapa se rellenen con suposiciones en los valores de etiqueta y campo correspondientes. Además, se muestra un muestreo de los datos analizados. Asegúrese de seleccionar Encabezados en Primera fila si sabe que el archivo incluye una fila de encabezado. La función de configuración utiliza esta información para identificar mejor las entradas de mapa resultantes.
Fuente
Descarga el origen de datos y realiza un análisis XML sencillo.
Los identificadores XPath resultantes se muestran en las filas Tag de la tabla Map y valores similares en Fields. Estas filas sólo identifican los datos disponibles y no generan las definiciones XPath más complicadas. Sin embargo, sigue siendo útil porque describe los datos XML e identifica los valores de Itemtag.
Nota: La función de mapas de configuración descarga el origen XML completo para realizar su análisis. Si el archivo es grande, esta operación podría agotarse.
Cuando se realiza correctamente, esta función identifica todos los elementos XPath posibles, muchos de los cuales no son deseables de usar. Asegúrese de examinar las definiciones de mapa resultantes y eliminar las que no necesita o desea.
XML
Descarga la dirección URL de un documento individual representativo, no la lista de vínculo principal. Este documento único se analiza utilizando el mismo mecanismo que se utiliza con las fuentes y se muestran los resultados.
Antes de hacer clic en Añadir para guardar la configuración, asegúrese de volver a cambiar la dirección URL al documento de lista del vínculo principal.
Importante : Es posible que la función de mapas de configuración no funcione para grandes conjuntos de datos XML porque el analizador de archivos intenta leer todo el archivo en la memoria. Como resultado, podría experimentar una condición de memoria insuficiente. Sin embargo, cuando se procesa el mismo documento en el momento de la indexación, no se lee en la memoria. En cambio, los documentos grandes se procesan "sobre la marcha" y no se leen en la memoria en primer lugar.
Uso de la Previsualización al agregar un conector de índice
En el momento de agregar un conector de índice, puede utilizar la función Preview para validar los datos, como si lo estuviera guardando. Ejecuta una prueba con la configuración, pero sin guardar la configuración en la cuenta. La prueba accede al origen de datos configurado. Sin embargo, escribe la caché de descarga en una ubicación temporal; no entra en conflicto con la carpeta de caché principal que utiliza el buscador de indexación.
Previsualización sólo procesa un valor predeterminado de cinco documentos, como se controla con Acct:IndexConnector-Previsualización-Max-Documentos. Los documentos previsualizados se muestran en el formulario de origen, a medida que se presentan en el buscador de indexación. La visualización es similar a una función "Origen de Vista" en un explorador Web. Puede desplazarse por los documentos del conjunto de previsualizaciones mediante los vínculos de navegación estándar.
Previsualización no admite configuraciones XML porque estos documentos se procesan directamente y no se descargan en la memoria caché.

Añadir una definición de conector de índice

Cada configuración de conector de índice define un origen de datos y asignaciones para relacionar los elementos de datos definidos para ese origen con los campos de metadatos del índice.
Antes de que los clientes vean los efectos de la nueva definición habilitada, vuelva a generar el índice del sitio.
Adición de una definición de conector de índice
  1. En el menú de producto, haga clic en Settings > Crawling > Index Connector .
  2. En la Stage Index Connector Definitions página, haga clic en Add New Index Connector .
  3. En la Index Connector Add página, establezca las opciones de conector que desee. Las opciones disponibles dependen del Type que haya seleccionado.
    Opción
    Descripción
    Nombre
    Nombre exclusivo de la configuración del conector de índice. Puede utilizar caracteres alfanuméricos. También se permiten los caracteres "_" y "-".
    Tipo
    La fuente de los datos. El tipo de fuente de datos que seleccione afecta a las opciones resultantes que están disponibles en la página Añadir conector de índice . Puede elegir entre las opciones siguientes:
    • Texto
      Archivos de texto planos sencillos, delimitados por comas, delimitados por tabuladores u otros formatos delimitados de forma consistente. Cada nueva línea de texto delimitada por líneas corresponde a un documento individual y se analiza utilizando el delimitador especificado.
      Puede asignar cada valor, o columna, a un campo de metadatos, al que se hace referencia mediante el número de columna, comenzando en 1 (uno).
    • Fuente
      Descarga un documento XML principal que contiene varias "filas" de información.
    • XML
      Descarga un documento XML principal que contiene vínculos ( <a> ) a documentos XML individuales.
    Tipo de fuente de datos: Texto
    Habilitado
    Activa la configuración "on" para rastrear e indexar. O bien, puede desactivar la configuración para evitar el rastreo y la indexación.
    Nota : Las configuraciones del conector de índice desactivadas se omiten si se encuentran en una lista de punto de entrada.
    Dirección del host
    Especifica la dirección del host del servidor donde se ubican los datos.
    Si lo desea, puede especificar una ruta URI completa (identificador uniforme de recursos) al documento de origen de datos como en los siguientes ejemplos:
    https://www.somewhere.com/some_path/some_file.xml
    o
    ftp://user:password@ftpserver.somewhere.com/some_path/some_file.xml
    El URI se desglosa en las entradas correspondientes para los campos Dirección del host, Ruta de archivo, Protocolo y, opcionalmente, Nombre de usuario y Contraseña.
    Especifica la dirección IP o la dirección URL del sistema host donde se encuentra el archivo de origen de datos.
    Ruta de archivo
    Especifica la ruta al archivo de texto plano simple, delimitado por comas, delimitado por tabuladores u otro archivo de formato delimitado por tabuladores.
    La ruta es relativa a la raíz de la dirección del host.
    Ruta incremental del archivo
    Especifica la ruta al archivo de texto plano simple, delimitado por comas, delimitado por tabuladores u otro archivo de formato delimitado por tabuladores.
    La ruta es relativa a la raíz de la dirección del host.
    Este archivo, si se especifica, se descarga y procesa durante las operaciones de aumento de índice. Si no se especifica ningún archivo, se utiliza el archivo que aparece en Ruta de archivo.
    Ruta de archivo vertical
    Especifica la ruta de acceso al archivo de texto plano simple, delimitado por comas, delimitado por tabuladores u otro archivo de formato delimitado de forma consistente que se utilizará durante una actualización vertical.
    La ruta es relativa a la raíz de la dirección del host.
    Este archivo, si se especifica, se descarga y procesa durante las operaciones de actualización vertical.
    Nota : Esta función no está habilitada de forma predeterminada. Póngase en contacto con la asistencia técnica para activar la función para su uso.
    Elimina la ruta del archivo
    Especifica la ruta al archivo de texto plano simple, que contiene un valor de identificador de documento único por línea.
    La ruta es relativa a la raíz de la dirección del host.
    Este archivo, si se especifica, se descarga y procesa durante las operaciones de aumento de índice. Los valores encontrados en este archivo se utilizan para generar solicitudes de "eliminación" para eliminar documentos indexados anteriormente. Los valores de este archivo deben corresponder a los valores encontrados en los archivos de ruta de archivo completa o incremental, en la columna identificada como clave principal .
    Nota : Esta función no está habilitada de forma predeterminada. Póngase en contacto con la asistencia técnica para activar la función para su uso.
    Protocolo
    Especifica el protocolo que se utiliza para acceder al archivo. Puede elegir entre las opciones siguientes:
    • HTTP
      Si es necesario, puede introducir las credenciales de autenticación adecuadas para acceder al servidor HTTP.
    • HTTPS
      Si es necesario, puede introducir las credenciales de autenticación adecuadas para acceder al servidor HTTPS.
    • FTP
      Debe especificar las credenciales de autenticación correctas para acceder al servidor FTP.
    • SFTP
      Debe especificar las credenciales de autenticación correctas para acceder al servidor SFTP.
    • Archivo
    Tiempo de espera
    Especifica el tiempo de espera, en segundos, para las conexiones FTP, SFTP, HTTP o HTTPS. Este valor debe estar entre 30 y 300.
    Reintentos
    Especifica el número máximo de reintentos para conexiones fallidas FTP, SFTP, HTTP o HTTPS. Este valor debe estar entre 0 y 10.
    Un valor de cero (0) impedirá los intentos de reintento.
    Codificación
    Especifica el sistema de codificación de caracteres que se utiliza en el archivo de origen de datos especificado.
    Delimitador
    Especifica el carácter que desea utilizar para delimitar cada campo del archivo de origen de datos especificado.
    El carácter de coma ( , ) es un ejemplo de delimitador. La coma actúa como delimitador de campo que ayuda a separar los campos de datos en el archivo de origen de datos especificado.
    ¿Seleccionar ficha? para utilizar el carácter de tabulación horizontal como delimitador.
    Encabezados en primera fila
    Indica que la primera fila del archivo de origen de datos contiene sólo información de encabezado, no datos.
    Número mínimo de documentos para indexar
    Si se establece en un valor positivo, esto especifica el número mínimo de registros esperados en el archivo descargado. Si se reciben menos registros, se anula la operación de índice.
    Nota : Esta función no está habilitada de forma predeterminada. Póngase en contacto con la asistencia técnica para activar la función para su uso.
    Nota : Esta función solo se utiliza durante las operaciones de índice completas.
    Mapa
    Especifica las asignaciones de columna a metadatos mediante números de columna.
    • Columna
      Especifica un número de columna, siendo la primera columna 1 (una). Para agregar nuevas filas de asignación para cada columna, en Acción , haga clic en + .
      No es necesario hacer referencia a cada columna en el origen de datos. En su lugar, puede omitir valores.
    • Campo
      Define el valor del atributo name que se utiliza para cada etiqueta <meta> generada.
    • Metadatos?
      Hace que Campo se convierta en una lista desplegable desde la que puede seleccionar campos de metadatos definidos para la cuenta actual.
      El valor Campo puede ser un campo de metadatos no definido, si lo desea. Un campo de metadatos no definido a veces resulta útil para crear contenido utilizado por Filtrado de secuencias de comandos .
      Cuando Conector de índice procesa documentos XML con varias visitas en cualquier campo de mapa, los valores múltiples se concatenan en un solo valor en el documento en caché resultante. De forma predeterminada, estos valores se combinan con un delimitador de coma. Sin embargo, supongamos que el valor Campo es un campo de metadatos definido. Además, ese campo tiene el conjunto de atributos Listas de permitidos . En este caso, el valor Delimitadores de Lista del campo, que es el primer delimitador definido, se utiliza en la concatenación.
    • ¿Clave principal?
      Sólo se identifica una definición del mapa como clave principal. Este campo se convierte en la referencia única que se presenta cuando se agrega este documento al índice. Este valor se utiliza en la dirección URL del documento en el índice.
      Los valores de Clave principal deben ser únicos en todos los documentos representados por la configuración del conector de índice; se omitirán los duplicados encontrados. Si los documentos de origen no contienen un solo valor único para su uso como clave principal , pero dos o más campos juntos pueden formar un identificador único, puede definir la clave principal combinando varios valores de columna con una barra vertical ("|") delimitando los valores.
    • ¿Eliminar HTML?
      Cuando se selecciona esta opción, se eliminan todas las etiquetas HTML que se encuentren en los datos de este campo.
    • Acción
      Permite agregar filas al mapa o quitar filas del mapa. El orden de las filas no es importante.
    Tipo de fuente de datos: Fuente
    Habilitado
    Activa la configuración "on" para rastrear e indexar. O bien, puede desactivar la configuración para evitar el rastreo y la indexación.
    Nota : Las configuraciones del conector de índice desactivadas se omiten si se encuentran en una lista de punto de entrada.
    Dirección del host
    Especifica la dirección IP o la dirección URL del sistema host donde se encuentra el archivo de origen de datos.
    Ruta de archivo
    Especifica la ruta al documento XML principal que contiene varias "filas" de información.
    La ruta es relativa a la raíz de la dirección del host.
    Ruta incremental del archivo
    Especifica la ruta al documento XML incremental que contiene varias "filas" de información.
    La ruta es relativa a la raíz de la dirección del host.
    Este archivo, si se especifica, se descarga y procesa durante las operaciones de aumento de índice. Si no se especifica ningún archivo, se utiliza el archivo que aparece en Ruta de archivo.
    Ruta de archivo vertical
    Especifica la ruta al documento XML que contiene varias "filas" dispersas de información que se utilizarán durante una actualización vertical.
    La ruta es relativa a la raíz de la dirección del host.
    Este archivo, si se especifica, se descarga y procesa durante las operaciones de actualización vertical.
    Nota : Esta función no está habilitada de forma predeterminada. Póngase en contacto con la asistencia técnica para activar la función para su uso.
    Elimina la ruta del archivo
    Especifica la ruta al archivo de texto plano simple, que contiene un valor de identificador de documento único por línea.
    La ruta es relativa a la raíz de la dirección del host.
    Este archivo, si se especifica, se descarga y procesa durante las operaciones de aumento de índice. Los valores encontrados en este archivo se utilizan para generar solicitudes de "eliminación" para eliminar documentos indexados anteriormente. Los valores de este archivo deben corresponder a los valores encontrados en los archivos de ruta de archivo completa o incremental, en la columna identificada como clave principal .
    Nota : Esta función no está habilitada de forma predeterminada. Póngase en contacto con la asistencia técnica para activar la función para su uso.
    Protocolo
    Especifica el protocolo que se utiliza para acceder al archivo. Puede elegir entre las opciones siguientes:
    • HTTP
      Si es necesario, puede introducir las credenciales de autenticación adecuadas para acceder al servidor HTTP.
    • HTTPS
      Si es necesario, puede introducir las credenciales de autenticación adecuadas para acceder al servidor HTTPS.
    • FTP
      Debe especificar las credenciales de autenticación correctas para acceder al servidor FTP.
    • SFTP
      Debe especificar las credenciales de autenticación correctas para acceder al servidor SFTP.
    • Archivo
    Itemtag
    Identifica el elemento XML que puede utilizar para identificar líneas XML individuales en el archivo de origen de datos que especificó.
    Por ejemplo, en el siguiente fragmento de fuente de un documento XML de Adobe, el valor de Itemtag es record :
    <?xml version="1.0" encoding="utf-8"?> <!DOCTYPE gsafeed PUBLIC "-//Google//DTD GSA Feeds//EN" ""> <gsafeed>      <header>           <datasource>marketplace</datasource>           <feedtype>incremental</feedtype>      </header>      <group action="add"> <record url=https://www.adobe.com/cfusion/marketplace_gsa index.cfm?event=marketplace.home&amp;marketplaceid=1 action="add" mimetype="text/html"displayurl="https://www.adobe.com/cfusion/marketplace/index.cfm?event=marketplace.home&amp;marketplaceid=1"><metadata> <meta name="mp_mkt" content="1"/> <meta name="mp_logo" content="/images/marketplace/ dbreferenced/marketplaceicons/icn_air.png"/> <meta name="title" content="Adobe AIR Marketplace"/> <meta name="description" content="Discover new applications ..."/> </metadata> <content><![CDATA[<html><head><title>Adobe AIR Marketplace</title></head><body>Discover new applications ...</body></html>]]></cntent> </record> <record url=https://www.adobe.com/cfusion/marketplace_gsa/ index.cfm?event=marketplace.home&amp;marketplaceid=2 action="add" mimetype="text/html" displayurl="https://www.adobe.com/cfusion/ marketplace/index.cfm?event=marketplace.home&amp;marketplaceid=2"> <metadata> <meta name="mp_mkt" content="2"/> <meta name="mp_logo" content="/images/marketplace/ dbreferenced/marketplaceicons/icn_photoshop.png"/> <meta name="title" content="Adobe Photoshop Marketplace"/> <meta name="description" content="Extend your creative possibilities ..."/> </metadata> <content><![CDATA[<html><head><title>Adobe Photoshop Marketplace</title></head><body>Extend your creative possibilities ...</body></html>]]>/content> </record> ... <record> ... </record>      </group> </gsafeed>
    Número mínimo de documentos para indexar
    Si se establece en un valor positivo, esto especifica el número mínimo de registros esperados en el archivo descargado. Si se reciben menos registros, se anula la operación de índice.
    Nota : Esta función no está habilitada de forma predeterminada. Póngase en contacto con la asistencia técnica para activar la función para su uso.
    Nota : Esta función solo se utiliza durante las operaciones de índice completas.
    Mapa
    Permite especificar asignaciones de elementos XML a metadatos mediante expresiones XPath.
    • Etiqueta
      Especifica una representación XPath de los datos XML analizados. Utilizando el documento XML de Adobe de ejemplo anterior, en la opción Itemtag, se puede asignar con la siguiente sintaxis:
      /record/@displayurl -> page-url /record/metadata/meta[@name='title']/@content -> title /record/metadata/meta[@name='description']/@content -> desc /record/metadata/meta[@name='description']/@content -> body
      La sintaxis anterior se traduce como:
      • /record/@displayurl&nbsp;->&nbsp;page-url
        El atributo display url del elemento record se asigna al campo de metadatos page-url .
      • /record/metadata/meta[@name='title']/@content&nbsp;->&nbsp;title
        El atributo content de cualquier metaelemento contenido dentro de un elemento de metadatos , que se encuentra dentro de un elemento record , cuyo atributo name es title , se asigna al título del campo de metadatos.
      • /record/metadata/meta[@name='description']/@content&nbsp;->&nbsp;desc
        El atributo content de cualquier meta contenido dentro de un elemento de metadatos , que se encuentra dentro del elemento record , cuyo atributo name es description , se asigna al campo de metadatos.
      • /record/metadata/meta[@name='description']/@content&nbsp;->&nbsp;body
        El atributo content de cualquier meta contenido dentro de un elemento de metadatos , que se encuentra dentro del elemento record , cuyo atributo name es description , se asigna al cuerpo del campo de metadatos.
      XPath es una notación relativamente complicada. Hay más información disponible en la siguiente ubicación:
    • Campo
      Define el valor del atributo name que se utiliza para cada etiqueta <meta> generada.
    • Metadatos?
      Hace que Campo se convierta en una lista desplegable desde la que puede seleccionar campos de metadatos definidos para la cuenta actual.
      El valor Campo puede ser un campo de metadatos no definido, si lo desea. Un campo de metadatos no definido a veces resulta útil para crear contenido utilizado por Filtrado de secuencias de comandos .
      Cuando Conector de índice procesa documentos XML con varias visitas en cualquier campo de mapa, los valores múltiples se concatenan en un solo valor en el documento en caché resultante. De forma predeterminada, estos valores se combinan con un delimitador de coma. Sin embargo, supongamos que el valor Campo es un campo de metadatos definido. Además, ese campo tiene el conjunto de atributos Listas de permitidos . En este caso, el valor Delimitadores de Lista del campo, que es el primer delimitador definido, se utiliza en la concatenación.
    • ¿Clave principal?
      Sólo se identifica una definición del mapa como clave principal. Este campo se convierte en la referencia única que se presenta cuando se agrega este documento al índice. Este valor se utiliza en la dirección URL del documento en el índice.
      Los valores de Clave principal deben ser únicos en todos los documentos representados por la configuración del conector de índice; se omitirán los duplicados encontrados. Si los documentos de origen no contienen un solo valor único para su uso como clave principal , pero dos o más campos juntos pueden formar un identificador único, puede definir la clave principal combinando varias definiciones de etiqueta con una barra vertical ("|") delimitando los valores.
    • ¿Eliminar HTML?
      Cuando se selecciona esta opción, se eliminan todas las etiquetas HTML que se encuentren en los datos de este campo.
    • ¿Se utiliza para eliminar?
      Solo se utiliza durante las operaciones de Índice incremental. Los registros que coinciden con este patrón XPath identifican los elementos que se deben eliminar. El valor de la clave principal para cada registro de este tipo se utiliza para construir solicitudes de "eliminación", como en Suprimir ruta de archivo.
      Nota : Esta función no está habilitada de forma predeterminada. Póngase en contacto con la asistencia técnica para activar la función para su uso.
    • Acción
      Permite agregar filas al mapa o quitar filas del mapa. El orden de las filas no es importante.
    Tipo de fuente de datos: XML
    Habilitado
    Activa la configuración "on" para rastrear e indexar. O bien, puede desactivar la configuración para evitar el rastreo y la indexación.
    Nota : Las configuraciones del conector de índice desactivadas se omiten si se encuentran en una lista de punto de entrada.
    Dirección del host
    Especifica la dirección URL del sistema host donde se encuentra el archivo de origen de datos.
    Ruta de archivo
    Especifica la ruta al documento XML principal que contiene vínculos ( <a> ) a documentos XML individuales.
    La ruta es relativa a la raíz de la dirección del host.
    Protocolo
    Especifica el protocolo que se utiliza para acceder al archivo. Puede elegir entre las opciones siguientes:
    • HTTP
      Si es necesario, puede introducir las credenciales de autenticación adecuadas para acceder al servidor HTTP.
    • HTTPS
      Si es necesario, puede introducir las credenciales de autenticación adecuadas para acceder al servidor HTTPS.
    • FTP
      Debe especificar las credenciales de autenticación correctas para acceder al servidor FTP.
    • SFTP
      Debe especificar las credenciales de autenticación correctas para acceder al servidor SFTP.
    • Archivo
    Nota : La configuración del protocolo solo se utiliza cuando hay información especificada en los campos Dirección del host y/o Ruta del archivo. Los documentos XML individuales se descargan mediante HTTP o HTTPS, según sus especificaciones de URL.
    Itemtag
    Identifica el elemento XML que define una "fila" en el archivo de origen de datos que especificó.
    Mapa
    Permite especificar asignaciones de columna a metadatos mediante números de columna.
    • Etiqueta
      Especifica una representación XPath de los datos XML analizados. Con el documento XML de Adobe de ejemplo anterior, en la opción Itemtag, puede asignarlo con la siguiente sintaxis:
      /record/@displayurl -> page-url /record/metadata/meta[@name='title']/@content -> title /record/metadata/meta[@name='description']/@content -> desc /record/metadata/meta[@name='description']/@content -> body
      La sintaxis anterior se traduce como:
      • /record/@displayurl&nbsp;->&nbsp;page-url
        El atributo display url del elemento record se asigna al campo de metadatos page-url .
      • /record/metadata/meta[@name='title']/@content&nbsp;->&nbsp;title
        El atributo content de cualquier metaelemento contenido dentro de un elemento de metadatos , que se encuentra dentro de un elemento record , cuyo atributo name es title , se asigna al título del campo de metadatos.
      • /record/metadata/meta[@name='description']/@content&nbsp;->&nbsp;desc
        El atributo content de cualquier meta contenido dentro de un elemento de metadatos , que se encuentra dentro del elemento record , cuyo atributo name es description , se asigna al campo de metadatos.
      • /record/metadata/meta[@name='description']/@content&nbsp;->&nbsp;body
        El atributo content de cualquier meta contenido dentro de un elemento de metadatos , que se encuentra dentro del elemento record , cuyo atributo name es description , se asigna al cuerpo del campo de metadatos.
      XPath es una notación relativamente complicada. Hay más información disponible en la siguiente ubicación:
    • Campo
      Define el valor del atributo name que se utiliza para cada etiqueta <meta> generada.
    • Metadatos?
      Hace que Campo se convierta en una lista desplegable desde la que puede seleccionar campos de metadatos definidos para la cuenta actual.
      El valor Campo puede ser un campo de metadatos no definido, si lo desea. Un campo de metadatos no definido a veces resulta útil para crear contenido utilizado por Filtrado de secuencias de comandos .
      Cuando Conector de índice procesa documentos XML con varias visitas en cualquier campo de mapa, los valores múltiples se concatenan en un solo valor en el documento en caché resultante. De forma predeterminada, estos valores se combinan con un delimitador de coma. Sin embargo, supongamos que el valor Campo es un campo de metadatos definido. Además, ese campo tiene el conjunto de atributos Listas de permitidos . En este caso, el valor Delimitadores de Lista del campo, que es el primer delimitador definido, se utiliza en la concatenación.
    • ¿Clave principal?
      Sólo se identifica una definición del mapa como clave principal. Este campo se convierte en la referencia única que se presenta cuando se agrega este documento al índice. Este valor se utiliza en la dirección URL del documento en el índice.
      Los valores de Clave principal deben ser únicos en todos los documentos representados por la configuración del conector de índice; se omitirán los duplicados encontrados. Si los documentos de origen no contienen un solo valor único para su uso como clave principal , pero dos o más campos juntos pueden formar un identificador único, puede definir la clave principal combinando varias definiciones de etiqueta con una barra vertical ("|") delimitando los valores.
    • ¿Eliminar HTML?
      Cuando se selecciona esta opción, se eliminan todas las etiquetas HTML que se encuentren en los datos de este campo.
    • Acción
      Permite agregar filas al mapa o quitar filas del mapa. El orden de las filas no es importante.
  4. (Opcional) Haga clic en Setup Maps para descargar una muestra de la fuente de datos. Los datos se examinan para determinar la idoneidad de la indexación. Esta función solo está disponible para tipos de fuente y texto.
  5. (Opcional) Haga clic en Preview para probar el funcionamiento real de la configuración. Esta función solo está disponible para tipos de fuente y texto.
  6. Haga clic Add para agregar la configuración a la Index Connector Definitions página y a la Index Connector Configurations lista desplegable de la URL Entrypoints página.
  7. En la Index Connector Definitions página, haga clic en rebuild your staged site index .
  8. (Opcional) En la Index Connector Definitions página, realice una de las siguientes acciones:

Edición de una definición de conector de índice

Puede editar un conector de índice existente que haya definido.
No todas las opciones están disponibles para cambiar, como Nombre del conector de índice o Tipo desde la lista Type desplegable.
Para editar una definición de conector de índice
  1. En el menú de producto, haga clic en Settings > Crawling > Index Connector .
  2. En la Index Connector página, debajo del encabezado de la Actions columna, haga clic en Edit para obtener un nombre de definición del conector de índice cuya configuración desee cambiar.
  3. En la Index Connector Edit página, configure las opciones que desee.
    Consulte la tabla de opciones en Añadir una definición de conector de índice.
  4. Haga clic Save Changes .
  5. (Opcional) En la Index Connector Definitions página, haga clic en rebuild your staged site index .
  6. (Opcional) En la Index Connector Definitions página, realice una de las siguientes acciones:

Visualización de la configuración de una definición de conector de índice

Puede revisar la configuración de una definición de conector de índice existente.
Después de agregar una definición de conector de índice a la Index Connector Definitions página, no podrá cambiar su configuración de tipo. En su lugar, debe eliminar la definición y luego agregar una nueva.
Vista de la configuración de una definición de conector de índice
  1. En el menú de producto, haga clic en Settings > Crawling > Index Connector .
  2. En la Index Connector página, debajo del encabezado de la Actions columna, haga clic en Edit para obtener un nombre de definición del conector de índice cuya configuración desee revisar o editar.

Copia de una definición de conector de índice

Puede copiar una definición de conector de índice existente para utilizarla como base para un nuevo conector de índice que desee crear.
Al copiar una definición de conector de índice, la definición copiada se desactiva de forma predeterminada. Para habilitar o "activar" la definición, debe editarla desde la Index Connector Edit página y seleccionar Enable .
Consulte Edición de una definición de conector de índice.
Para copiar una definición de conector de índice
  1. En el menú de producto, haga clic en Settings > Crawling > Index Connector .
  2. En la Index Connector página, debajo del encabezado de la Actions columna, haga clic en Copy para obtener un nombre de definición del conector de índice cuya configuración desee duplicado.
  3. En la Index Connector Copy página, escriba el nuevo nombre de la definición.
  4. Haga clic Copy .
  5. (Opcional) En la Index Connector Definitions página, realice una de las siguientes acciones:

Cambio de nombre de una definición de conector de índice

Puede cambiar el nombre de una definición de conector de índice existente.
Después de cambiar el nombre de la definición, marque Settings > Crawling > URL Entrypoints . Desea asegurarse de que el nombre de la nueva definición se refleja en la lista desplegable de la URL Entrypoints página.
Cambio del nombre de una definición de conector de índice
  1. En el menú de producto, haga clic en Settings > Crawling > Index Connector .
  2. En la Index Connector página, debajo del encabezado de la Actions columna, haga clic en Rename para obtener el nombre de definición del conector de índice que desee cambiar.
  3. En la Index Connector Rename página, introduzca el nuevo nombre de la definición en el Name campo.
  4. Haga clic Rename .
  5. Haga clic en Settings > Crawling > URL Entrypoints . Si el nombre del conector de índice anterior está presente en la lista, elimínelo y añada la entrada con el nuevo nombre.
    Consulte Añadir varios puntos de entrada de URL que desea indizar . 1. (Opcional) En la Index Connector Definitions página, realice una de las siguientes acciones:

Eliminación de una definición de conector de índice

Puede eliminar una definición de conector de índice existente que ya no necesite ni use.
Eliminar una definición de conector de índice
  1. En el menú de producto, haga clic en Settings > Crawling > Index Connector .
  2. En la Index Connector Definitions página, debajo del encabezado de la Actions columna, haga clic en Delete para el nombre de definición del conector de índice que desee eliminar.
  3. En la Index Connector Delete página, haga clic en Delete .