Show Menu
ARGOMENTI×

Informazioni sul controllo remoto per l'indicizzazione

Ogni volta che il sito Web cambia, è possibile eseguire uno script o un programma che richiede che il robot di ricerca esegua un indice utilizzando il telecomando.

Utilizzo del controllo remoto per l'indicizzazione

La richiesta di indicizzazione del telecomando proviene in genere da uno script o da un programma che si trova sul server.
Il robot esegue gli stessi passaggi di indicizzazione come se fosse stato avviato manualmente dal Index menu. Per inviare una richiesta di controllo remoto, configurate la password e le stringhe di risposta necessarie.

Come effettuare una richiesta di controllo remoto

Per effettuare una richiesta di controllo remoto, utilizzate i seguenti esempi di formato in base alla posizione del datacenter:
Posizione del centro dati
Esempio
Londra
https://center.lon5.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op
America del Nord
https://center.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op
Singapore
https://center.sin2.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op
 oppure 
Stringa e valore
Descrizione
sp_a= sp9999999
Numero del tuo account.
Potete trovare il vostro numero di account in Impostazioni > Opzioni account > Impostazioni account.
sp_lines= N
Consente di controllare lo stato di una ricerca per indicizzazione in esecuzione.
N è un numero intero positivo o tutto . Se si tratta di un valore numerico, le ultime N righe del file di registro di indice corrispondente sono incluse nella risposta JSON.
Se il valore è tutto , viene restituito l’intero file.
Se il valore è 0 , non viene restituita alcuna informazione di registro. Questo valore è il valore predefinito per una query di stato dell'indice in esecuzione.
sp_operation= op
Consente di specificare una delle seguenti operazioni di indicizzazione da eseguire:
  • full_index
    Il robot di ricerca esegue un indice completo del sito Web.
  • incremental_index
    Il robot di ricerca esegue un indice incrementale utilizzando la configurazione impostata in Index > Incremental Index > Configuration.
  • vertical_index
    Il robot di ricerca esegue un aggiornamento verticale utilizzando la configurazione impostata in Index > Vertical Update > Configuration.
  • script_index
    Il robot di ricerca esegue un indice incrementale utilizzando il file di testo specificato in Index > Scripted Index > Configuration.
  • full_stage_index
    Il robot di ricerca esegue un indice completo del sito Web.
  • incremental_stage_index
    Il robot di ricerca esegue un indice incrementale in fase utilizzando la configurazione impostata in Indice > Indice incrementale > Configurazione.
  • vertical_stage_index
    Il robot di ricerca esegue un aggiornamento in fase verticale utilizzando la configurazione impostata in Indice > Aggiornamento verticale > Configurazione.
Nota: Per utilizzare Aggiornamenti verticali, potrebbe essere necessario che nel vostro account sia attivato dal rappresentante commerciale Adobe o dal supporto Adobe.
Per fare in modo che il robot di ricerca tenti di usare il contenuto salvato, potete aggiungere _saved a uno qualsiasi dei valori sp_operation riportati sopra. Ad esempio, potete specificare quanto segue:
sp_operation=full_index_saved
 oppure 
sp_operation=full_staged_index_saved
In alternativa, potete aggiungere _status a uno qualsiasi dei valori sp_operation riportati sopra per richiedere un rapporto sullo stato dell'operazione corrente o più recente. Ad esempio, potete specificare quanto segue:
sp_operation=full_index_status
 oppure 
sp_operation=full_staged_index_status
e i risultati vengono restituiti come oggetto JSON. Includere sp_lines=N per includere N righe del file di registro associato. Se N è negativo, vengono incluse le ultime N linee.
sp_operation= push live
Consente di inviare in remoto un indice live in fase.
Ogni tentativo di aggiungere _saved all'operazione live push viene ignorato.
Quando si esegue un'operazione push , al server viene restituita una stringa di testo OK, Priorità o Errore. Queste stringhe di risposta vengono specificate nella pagina Controllo remoto .
Se si esegue il push live in assenza di un indice in fase, non si verifica nulla e viene restituita la stringa di risposta OK.
sp_password= xxxxxx
La password del telecomando.
La ricerca restituisce i dati sotto forma di risposta HTTP corretta. La risposta completa è composta da uno stato HTTP, intestazioni di risposta HTTP, una riga vuota e la stringa di risposta.
Ad esempio, si supponga di eseguire la seguente richiesta di controllo remoto:
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index

Segue la risposta del server:
Status: 200 OK 
Content-type: text/plain 
OK

In alternativa, si supponga di eseguire la seguente richiesta di stato del telecomando:
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status

La risposta del server potrebbe essere simile a quella riportata di seguito:
Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:58:58-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "status": 1, 
    "message": "ok" 
}

Per ottenere le prime dieci righe dell'elenco di log associato a questa operazione di indice, insieme al relativo stato, viene utilizzata la seguente query:
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=10

La risposta dal server:
Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:59:30-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "offset": 672, 
    "lines": [ 
        "07/25 16:40:07 PST   ======== Starting manual crawl of account sp99999999. ========", 
        "07/25 16:40:08 PST   Loading existing data", 
        "07/25 16:40:08 PST   Downloading entrypoint https://www.atomz.com/", 
        "07/25 16:40:08 PST   Robots.txt exclude mask: https://www.atomz.com/snap", 
        "07/25 16:40:08 PST   Exclude mask: regexp ^https://www.atomz.com/$", 
        "07/25 16:40:08 PST   Include mask: https://www.atomz.com/", 
        "07/25 16:40:08 PST   Downloading https://www.atomz.com/style.css", 
        "07/25 16:40:09 PST   Ignoring https://www.atomz.com/style.css, document type 'text/css'.", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/privacy.html", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/terms.html" 
    ], 
    "status": 1, 
    "message": "ok" 
}

Note the offset value. Questo valore identifica la posizione di offset del file nel file di registro in cui la lettura ha lasciato fuori. Per leggere le dieci righe successive nel file, includereste, in questo esempio, &sp_offset=672 nella richiesta inviata al server.
Utilizzando sp_offset questa funzione, è possibile scorrere efficacemente una pagina all'interno di un file di registro.
Per ottenere le ultime dieci righe del registro, insieme allo stato, specificate il conteggio come numero negativo. Ad esempio, specificate sp_lines= con un valore di -10 come nell'esempio seguente:
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=-10

La risposta dal server:
Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T11:01:14-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "lines": [ 
        "07/25 16:40:20 PST   End Time: 07/25/2017 16:40:20 PST", 
        "07/25 16:40:20 PST   Elapsed Time: 13 seconds", 
        "07/25 16:40:20 PST   Pages Crawled: 3 pages", 
        "07/25 16:40:20 PST   Pages Indexed: 3 pages", 
        "07/25 16:40:20 PST   Words/Bytes Indexed: 2373 words/ 20618 bytes", 
        "07/25 16:40:20 PST   Errors: 0", 
        "07/25 16:40:20 PST   *** Index Summary ***", 
        "07/25 16:40:20 PST   Total Pages: 3", 
        "07/25 16:40:20 PST   --------------------------------------------------------------------", 
        "07/25 16:40:20 PST   ======== Finish manual crawl of account sp99999999: Done. ========" 
    ], 
    "status": 1, 
    "message": "ok" 
}

Non viene restituito alcun offset valore, poiché l'operazione è terminata alla fine del file e non sono presenti altre righe da leggere.

Configurazione del controllo remoto per l'indicizzazione

Ogni volta che il sito Web cambia, è possibile utilizzare il controllo remoto per eseguire uno script o un programma dal server, richiedendo che il robot di ricerca esegua un indice.
Per configurare il controllo remoto per l'indicizzazione
  1. Scegliere Index > Remote Control dal menu del prodotto.
  2. Nella Remote Control pagina, impostate ogni opzione del campo di configurazione in modo da poter inviare automaticamente una richiesta di indicizzazione dal server per indicizzare il sito Web.
    Opzione
    Descrizione
    Password controllo remoto
    Specificare la password del telecomando.
    Le password sono sensibili alle maiuscole/minuscole, con una lunghezza di almeno sei caratteri e devono includere almeno una lettera. È consigliabile includere anche almeno un numero.
    Non utilizzate la password di accesso per la ricerca nel sito/merchandising.
    La password viene utilizzata in ogni richiesta di controllo remoto.
    Stringa di risposta OK
    Consente di specificare una stringa di testo di risposta OK se l'operazione di indice richiesta ha inizio correttamente. In questi casi, il robot di ricerca restituisce la stringa di risposta OK al server.
    Stringa risposta priorità
    Se durante la richiesta remota è in corso un'altra operazione di indicizzazione, il robot di ricerca non è in grado di eseguire l'indice richiesto. In questi casi, la stringa di testo della risposta Priority viene restituita al server.
    Stringa risposta errore
    Consente di specificare una stringa di testo per la risposta a un errore Se la password non è corretta o se si verifica un altro errore. In questi casi, il robot di ricerca restituisce la stringa di risposta Errore al server.
  3. Clic Save Changes .