Show Menu
TEMAS×

Acerca del control remoto para indexación

Siempre que cambie el sitio web, puede ejecutar un script o programa que solicite que el robot de búsqueda ejecute un índice mediante el control remoto.

Uso del control remoto para la indexación

La solicitud de indexación de control remoto suele proceder de una secuencia de comandos o un programa que se encuentra en el servidor.
El robot realiza los mismos pasos de indexación que si se hubiera iniciado manualmente desde el Index menú. Para enviar una solicitud de control remoto, configure la contraseña y las cadenas de respuesta necesarias.

Cómo realizar una solicitud de control remoto

Para realizar una solicitud de control remoto, utilice los siguientes ejemplos de formato basados en la ubicación del centro de datos:
Ubicación del centro de datos
Ejemplo
Londres
https://center.lon5.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op
América del Norte
https://center.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op
Singapur
https://center.sin2.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op
o
Cadena y valor
Descripción
sp_a= sp999999999
Su número de cuenta.
Puede encontrar su número de cuenta en Configuración > Opciones de cuenta > Configuración de cuenta.
sp_lines= N
Permite comprobar el estado de un rastreo de índice en ejecución.
N es un entero positivo o todo . Si se trata de un valor numérico, las últimas líneas N del archivo de registro de índice correspondiente se incluyen en la respuesta JSON.
Si el valor es todo , se devuelve el archivo completo.
Si el valor es 0 , no se devuelve información de registro. Este valor es el predeterminado para una consulta de estado de índice en ejecución.
sp_operation= op
Permite especificar una de las siguientes operaciones de indexación que desea ejecutar:
  • full_index
    El robot de búsqueda ejecuta un índice completo de su sitio web.
  • incremental_index
    El robot de búsqueda ejecuta un índice incremental utilizando la configuración establecida en Índice > Índice incremental > Configuración.
  • vertical_index
    El robot de búsqueda ejecuta una actualización vertical utilizando la configuración establecida en Índice > Actualización vertical > Configuración.
  • script_index
    El robot de búsqueda ejecuta un índice incremental utilizando el archivo de texto especificado en Índice > Índice con secuencias de comandos > Configuración.
  • full_staged_index
    El robot de búsqueda ejecuta un índice de etapas completo del sitio web.
  • incremental_staged_index
    El robot de búsqueda ejecuta un índice escalonado incremental utilizando la configuración establecida en Índice > Índice incremental > Configuración.
  • vertical_staged_index
    El robot de búsqueda ejecuta una actualización vertical escalonada utilizando la configuración establecida en Índice > Actualización vertical > Configuración.
Nota: Para utilizar las actualizaciones verticales, es posible que su representante de cuentas de Adobe o la asistencia técnica de Adobe deban habilitarlo en su cuenta.
Puede anexar _saved a cualquiera de los valores sp_operation anteriores para que el robot de búsqueda intente utilizar contenido guardado. Por ejemplo, puede especificar lo siguiente:
sp_operation=full_index_saved
o
sp_operation=full_staged_index_saved
O bien, puede anexar _status a cualquiera de los valores sp_operation anteriores para solicitar un informe de estado para la operación actual o más reciente. Por ejemplo, puede especificar lo siguiente:
sp_operation=full_index_status
o
sp_operation=full_staged_index_status
y los resultados se devuelven como un objeto JSON. Incluya sp_lines=N para incluir las líneas N del archivo de registro asociado. Si N es negativo, se incluyen las últimas líneas N.
sp_operation= pushlive
Permite insertar de forma remota un índice escalonado.
Se ignora cualquier intento de anexar _saved a la operación push live.
Cuando se ejecuta una operación push, se devuelve al servidor una cadena de texto de respuesta OK, Priority o Error. Puede especificar estas cadenas de respuesta en la página Control remoto.
Si inserta live cuando no hay un índice de ensayo, no sucede nada y se devuelve la cadena de respuesta OK.
sp_password= xxxxxx
La contraseña del control remoto.
La búsqueda devuelve datos en forma de una respuesta HTTP adecuada. La respuesta completa se compone de un estado HTTP, encabezados de respuesta HTTP, una línea en blanco y la cadena de respuesta.
Por ejemplo, supongamos que realiza la siguiente solicitud de control remoto:
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index

A continuación se muestra la respuesta del servidor:
Status: 200 OK 
Content-type: text/plain 
OK

O bien, supongamos que realiza la siguiente solicitud de estado de control remoto:
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status

La respuesta del servidor puede tener el siguiente aspecto:
Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:58:58-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "status": 1, 
    "message": "ok" 
}

Para obtener las diez primeras líneas del listado de registros asociado con esta operación de índice, junto con su estado, se utiliza la siguiente consulta:
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=10

La respuesta del servidor:
Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:59:30-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "offset": 672, 
    "lines": [ 
        "07/25 16:40:07 PST   ======== Starting manual crawl of account sp99999999. ========", 
        "07/25 16:40:08 PST   Loading existing data", 
        "07/25 16:40:08 PST   Downloading entrypoint https://www.atomz.com/", 
        "07/25 16:40:08 PST   Robots.txt exclude mask: https://www.atomz.com/snap", 
        "07/25 16:40:08 PST   Exclude mask: regexp ^https://www.atomz.com/$", 
        "07/25 16:40:08 PST   Include mask: https://www.atomz.com/", 
        "07/25 16:40:08 PST   Downloading https://www.atomz.com/style.css", 
        "07/25 16:40:09 PST   Ignoring https://www.atomz.com/style.css, document type 'text/css'.", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/privacy.html", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/terms.html" 
    ], 
    "status": 1, 
    "message": "ok" 
}

Note the offset value. Este valor identifica la posición de desplazamiento del archivo en el archivo de registro en el que se ha dejado de leer. Para leer las siguientes diez líneas del archivo, debe incluir, en este ejemplo, &sp_offset=672 la solicitud enviada al servidor.
Con sp_offset esto, puede desplazarse por un archivo de registro.
Para obtener las últimas diez líneas del registro, junto con el estado, especifique el recuento como un número negativo. Por ejemplo, especifique sp_lines= con un valor -10 como en el siguiente ejemplo:
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=-10

La respuesta del servidor:
Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T11:01:14-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "lines": [ 
        "07/25 16:40:20 PST   End Time: 07/25/2017 16:40:20 PST", 
        "07/25 16:40:20 PST   Elapsed Time: 13 seconds", 
        "07/25 16:40:20 PST   Pages Crawled: 3 pages", 
        "07/25 16:40:20 PST   Pages Indexed: 3 pages", 
        "07/25 16:40:20 PST   Words/Bytes Indexed: 2373 words/ 20618 bytes", 
        "07/25 16:40:20 PST   Errors: 0", 
        "07/25 16:40:20 PST   *** Index Summary ***", 
        "07/25 16:40:20 PST   Total Pages: 3", 
        "07/25 16:40:20 PST   --------------------------------------------------------------------", 
        "07/25 16:40:20 PST   ======== Finish manual crawl of account sp99999999: Done. ========" 
    ], 
    "status": 1, 
    "message": "ok" 
}

Tenga en cuenta que aquí no se devuelve ningún offset valor, ya que esta operación finalizó al final del archivo y no hay más líneas que leer.

Configuración del control remoto para la indexación

Siempre que cambie el sitio web, puede utilizar el control remoto para ejecutar un script o programa desde el servidor, solicitando que el robot de búsqueda ejecute un índice.
Para configurar el control remoto para indexar
  1. En el menú de producto, haga clic en Index > Remote Control .
  2. En la página, establezca cada opción de campo de configuración para poder enviar una solicitud de indexación desde el servidor automáticamente para indexar el sitio web. Remote Control
    Opción
    Descripción
    Contraseña de control remoto
    Especifique la contraseña del control remoto.
    Las contraseñas distinguen entre mayúsculas y minúsculas, tienen al menos seis caracteres y deben incluir al menos una letra. Se recomienda incluir al menos un número.
    No utilice la contraseña de inicio de sesión de búsqueda/comercialización del sitio.
    Su contraseña se utiliza en cada solicitud de control remoto.
    Cadena de respuesta correcta
    Permite especificar una cadena de texto de respuesta OK si la operación de índice solicitada comienza correctamente. En estos casos, el robot de búsqueda devuelve la cadena de respuesta OK al servidor.
    Cadena de respuesta de prioridad
    Si hay otra operación de indexación en curso cuando se realiza la solicitud remota, el robot de búsqueda no puede realizar el índice solicitado. En estos casos, la cadena de texto de respuesta de prioridad se devuelve al servidor.
    Cadena de respuesta de error
    Permite especificar una cadena de texto de respuesta a un error Si la contraseña es incorrecta o si se produce otro error. En estos casos, el robot de búsqueda devuelve la cadena de respuesta Error al servidor.
  3. Haga clic Save Changes .