Show Menu
SUJETS×

A propos du contrôle à distance pour l'indexation

Chaque fois que votre site Web change, vous pouvez exécuter un script ou un programme demandant au robot de recherche d'exécuter un index à l'aide de la télécommande.

Utilisation du contrôle à distance pour l'indexation

La demande d’indexation de la télécommande provient généralement d’un script ou d’un programme situé sur votre serveur.
Le robot effectue les mêmes étapes d'indexation que si elle avait été lancée manuellement à partir du Index menu. Pour envoyer une demande de contrôle à distance, vous devez configurer le mot de passe et les chaînes de réponse nécessaires.

Comment effectuer une demande de contrôle à distance

Pour effectuer une demande de contrôle à distance, utilisez les exemples de format suivants en fonction de l’emplacement de votre centre de données :
Emplacement du centre de données
Exemple
Londres
https://center.lon5.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op
Amérique du Nord
https://center.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op
Singapour
https://center.sin2.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op
ou
Chaîne et valeur
Description
sp_a= sp99999999
Votre numéro de compte.
Vous pouvez trouver votre numéro de compte sous Paramètres > Options de compte > Paramètres du compte.
sp_lines= N
Permet de vérifier l’état d’une analyse d’index en cours d’exécution.
N est un entier positif ou tout . S’il s’agit d’une valeur numérique, les N dernières lignes du fichier journal d’index correspondant sont incluses dans la réponse JSON.
Si la valeur est all , le fichier entier est renvoyé.
Si la valeur est 0 , aucune information de journal n’est renvoyée. Il s’agit de la valeur par défaut d’une requête d’état d’index en cours d’exécution.
sp_operation= op
Permet de spécifier l’une des opérations d’indexation suivantes à exécuter :
  • full_index
    Le robot de recherche exécute un index complet de votre site Web.
  • incremental_index
    Le robot de recherche exécute un index incrémentiel à l’aide de la configuration définie sous Index > Index incrémentiel > Configuration.
  • vertical_index
    Le robot de recherche exécute une mise à jour verticale à l’aide de la configuration définie sous Index > Mise à jour verticale > Configuration.
  • script_index
    Le robot de recherche exécute un index incrémentiel à l’aide du fichier texte spécifié sous Index > Index par script > Configuration .
  • full_staged_index
    Le robot de recherche exécute un index complet par étape de votre site Web.
  • incremental_staged_index
    Le robot de recherche exécute un index intermédiaire incrémentiel à l’aide de la configuration définie sous Index > Index incrémentiel > Configuration.
  • vertical_staged_index
    Le robot de recherche exécute une mise à jour verticale par étapes à l’aide de la configuration définie sous Index > Mise à jour verticale > Configuration.
Remarque : Pour utiliser les mises à jour verticales, vous devrez peut-être l’activer dans votre compte par votre représentant de compte Adobe ou par l’assistance d’Adobe.
Vous pouvez ajouter _save à l’une des valeurs _operation ci-dessus pour que le robot de recherche tente d’utiliser du contenu enregistré. Par exemple, vous pouvez spécifier les éléments suivants :
sp_operation=full_index_saved
ou
sp_operation=full_staged_index_saved
Vous pouvez également ajouter _status à l’une des valeurs _operation ci-dessus pour demander un rapport d’état pour l’opération en cours ou la plus récente. Par exemple, vous pouvez spécifier les éléments suivants :
sp_operation=full_index_status
ou
sp_operation=full_staged_index_status
et les résultats sont renvoyés sous la forme d’un objet JSON. Incluez sp_lines=N pour inclure N lignes du fichier journal associé. Si N est négatif, les N dernières lignes sont incluses.
sp_operation= push_live
Vous permet de diffuser un index par étapes à distance.
Toute tentative d’ajout de _enregistré à l’opération de diffusion en direct est ignorée.
Lorsque vous exécutez une opération push-live , une chaîne de texte OK, Priority ou Error est renvoyée au serveur. Vous spécifiez ces chaînes de réponse sur la page Contrôle à distance .
Si vous poussez en direct en l’absence d’index d’évaluation, rien ne se passe et la chaîne de réponse OK est renvoyée.
sp_password= xxxxxx
Mot de passe de la télécommande.
La recherche renvoie des données sous la forme d’une réponse HTTP appropriée. La réponse complète se compose d’un état HTTP, d’en-têtes de réponse HTTP, d’une ligne vide et de la chaîne de réponse.
Supposons, par exemple, que vous exécutiez la demande de contrôle à distance suivante :
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index

Voici la réponse du serveur :
Status: 200 OK 
Content-type: text/plain 
OK

Supposons également que vous exécutiez la demande d’état de contrôle à distance suivante :
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status

La réponse du serveur peut se présenter comme suit :
Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:58:58-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "status": 1, 
    "message": "ok" 
}

Pour obtenir les dix premières lignes de la liste des journaux associées à cette opération d’index, ainsi que son état, la requête suivante est utilisée :
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=10

Réponse du serveur :
Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:59:30-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "offset": 672, 
    "lines": [ 
        "07/25 16:40:07 PST   ======== Starting manual crawl of account sp99999999. ========", 
        "07/25 16:40:08 PST   Loading existing data", 
        "07/25 16:40:08 PST   Downloading entrypoint https://www.atomz.com/", 
        "07/25 16:40:08 PST   Robots.txt exclude mask: https://www.atomz.com/snap", 
        "07/25 16:40:08 PST   Exclude mask: regexp ^https://www.atomz.com/$", 
        "07/25 16:40:08 PST   Include mask: https://www.atomz.com/", 
        "07/25 16:40:08 PST   Downloading https://www.atomz.com/style.css", 
        "07/25 16:40:09 PST   Ignoring https://www.atomz.com/style.css, document type 'text/css'.", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/privacy.html", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/terms.html" 
    ], 
    "status": 1, 
    "message": "ok" 
}

Note the offset value. Cette valeur identifie la position du décalage de fichier dans le fichier journal où la lecture est laissée en suspens. Pour lire les dix lignes suivantes du fichier, vous devez inclure, dans cet exemple, &sp_offset=672 dans la requête envoyée au serveur.
Grâce sp_offset à cette fonctionnalité, vous pouvez parcourir un fichier journal de manière efficace.
Pour obtenir les dix dernières lignes du journal, ainsi que l’état, indiquez le nombre comme nombre négatif. Par exemple, spécifiez sp_lines= la valeur -10 comme suit :
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=-10

Réponse du serveur :
Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T11:01:14-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "lines": [ 
        "07/25 16:40:20 PST   End Time: 07/25/2017 16:40:20 PST", 
        "07/25 16:40:20 PST   Elapsed Time: 13 seconds", 
        "07/25 16:40:20 PST   Pages Crawled: 3 pages", 
        "07/25 16:40:20 PST   Pages Indexed: 3 pages", 
        "07/25 16:40:20 PST   Words/Bytes Indexed: 2373 words/ 20618 bytes", 
        "07/25 16:40:20 PST   Errors: 0", 
        "07/25 16:40:20 PST   *** Index Summary ***", 
        "07/25 16:40:20 PST   Total Pages: 3", 
        "07/25 16:40:20 PST   --------------------------------------------------------------------", 
        "07/25 16:40:20 PST   ======== Finish manual crawl of account sp99999999: Done. ========" 
    ], 
    "status": 1, 
    "message": "ok" 
}

Notez qu’aucune offset valeur n’est renvoyée ici, car cette opération s’est terminée à la fin du fichier et qu’il n’y a plus de lignes à lire.

Configuration du contrôle à distance pour l’indexation

Chaque fois que votre site Web change, vous pouvez utiliser Remote Control pour exécuter un script ou un programme à partir de votre serveur, en demandant au robot de recherche d'exécuter un index.
Pour configurer Remote Control pour l'indexation
  1. Dans le menu du produit, cliquez sur Index > Remote Control .
  2. Sur la Remote Control page, définissez chaque option de champ de configuration pour pouvoir envoyer automatiquement une requête d’indexation de votre serveur afin d’indexer votre site Web.
    Option
    Description
    Mot de passe de contrôle à distance
    Indiquez le mot de passe de la télécommande.
    Les mots de passe sont sensibles à la casse (au moins six caractères) et doivent comprendre au moins une lettre. Il est recommandé d’inclure également au moins un nombre.
    N’utilisez pas le mot de passe de connexion de recherche/marchandisage de votre site.
    Votre mot de passe est utilisé dans chaque demande de contrôle à distance.
    Chaîne de réponse OK
    Permet de spécifier une chaîne de texte de réponse OK si l’opération d’index demandée commence avec succès. Dans ce cas, le robot de recherche renvoie votre chaîne de réponse OK au serveur.
    Chaîne de réponse de priorité
    Si une autre opération d'indexation est en cours lorsque la demande distante est effectuée, le robot de recherche ne peut pas exécuter l'index demandé. Dans ce cas, votre chaîne de texte de réponse de priorité est renvoyée au serveur.
    Chaîne de réponse d’erreur
    Permet de spécifier une chaîne de texte de réponse à une erreur si votre mot de passe est incorrect ou en cas d’erreur. Dans ce cas, le robot de recherche renvoie votre chaîne de réponse d’erreur au serveur.
  3. Cliquez sur Save Changes .