Show Menu
SUJETS×

Index incrémentiel

Vous pouvez utiliser l’index incrémentiel pour indexer des "morceaux" de votre site Web en direct ou d’évaluation, comme une collection de pages fréquemment modifiées.

Utilisation de l’index incrémentiel

Un index incrémentiel ne prend que quelques secondes et est utile sur les sites Web de grande capacité qui peuvent prendre plusieurs heures pour complètement indexer.
Lorsque vous générez un index incrémentiel, des informations d’état s’affichent, telles que l’heure de début, l’heure écoulée et les erreurs survenues pendant le processus d’indexation. Des informations sur l’état de votre dernier index s’affichent également.
Vous pouvez arrêter ou redémarrer le processus d’indexation incrémentielle à tout moment.
Pendant que le nouvel index incrémentiel est généré pour votre site Web en ligne, les clients peuvent continuer à rechercher votre site à l’aide de votre dernier index incrémentiel.

Configuration d’un index incrémentiel d’un site Web intermédiaire

Vous pouvez configurer les pages de site Web que vous souhaitez inclure dans votre index incrémentiel en spécifiant les URL de site Web et les masques d’URL.
Pour configurer un index incrémentiel d’un site Web intermédiaire
  1. Dans le menu du produit, cliquez sur Index > Incremental Index > Configuration .
  2. Sur la Incremental Index Configuration page, utilisez les différents champs pour spécifier les pages à indexer.
    Champ
    Description
    Ajout ou mise à jour d’URL
    Spécifiez des URL.
    Le robot de recherche indexe uniquement les documents spécifiés qui ont changé depuis la dernière indexation.
    De plus, le robot de recherche suit les liens contenus dans les documents spécifiés et indexe uniquement les documents qui ont changé.
    Ce champ ne doit contenir que des URL de document et non des masques, comme dans l’exemple suivant :
    https://www.mydomain.com/products/new.html
    Vous pouvez utiliser les mots-clés suivants avec l’URL :
    • noindex
      Si vous ne souhaitez pas indexer le texte de la page qui correspond à une URL spécifiée, mais que vous souhaitez suivre les liens de la page, ajoutez noindex après l’URL, comme dans l’exemple suivant :
      https://www.mydomain.com/products/new.html noindex
      Assurez-vous de bien séparer noindex de l’URL avec un espace ; une virgule n’est pas un séparateur valide.
    • nofollow
      Si vous souhaitez indexer le texte de la page qui correspond à l’URL spécifiée, mais que vous ne souhaitez pas suivre les liens de la page, ajoutez nofollow après l’URL, comme dans l’exemple suivant :
      https://www.mydomain.com/products/new.html nofollow
      Assurez-vous de bien séparer nofollow de l’URL avec un espace ; une virgule n’est pas un séparateur valide.
    Rechercher et mettre à jour des masques d’URL
    Spécifiez des masques d’URL simples (chemin complet, chemin partiel ou chemins utilisant des caractères génériques ou des expressions régulières).
    Le robot de recherche ne trouve tous les documents et index correspondants que ceux qui ont changé depuis la dernière indexation.
    De plus, le robot de recherche suit les liens contenus dans les documents et index correspondants uniquement les pages qui ont changé. Par exemple :
    https://www.mydomain.com/products/household/*.html
    Vous pouvez également utiliser des expressions régulières, comme dans l’exemple suivant :
    regexp ^https://www\.mondomaine\.com/products/home/.*\.html$
    Vous pouvez également utiliser les mots-clés nofollow et noindex comme décrit dans Ajout ou mise à jour d’URL ci-dessus.
    Inclure et exclure les masques d’URL
    Spécifiez des masques d’URL simples à inclure ou à exclure (chemin complet, chemin partiel ou chemins utilisant des caractères génériques ou des expressions régulières).
    Le robot de recherche trouve et indexe ("include") ou ignore les documents ("exclude") en fonction du type de masque spécifié.
    Lors de l’indexation d’un site, les directions sont suivies par ordre d’apparence. Par exemple, la liste suivante de masques :
    inclure https://www.mydomain.com/products/household/lightbulbs*.html
    exclure https://www.mydomain.com/products/
    indexe les pages lightbulbs1.html et lightbulbs2.html . Toutefois, il n’indexe aucune autre page répertoriée sous le répertoire products.
    Un masque d’URL qui s’affiche en premier prévaut toujours sur un masque qui s’affiche plus loin dans la liste. De plus, si le robot de recherche rencontre un document qui correspond à la fois à un masque d’inclusion et à un masque d’exclusion, le masque répertorié en premier est prioritaire.
    Vous pouvez également utiliser les mots-clés nofollow et noindex comme décrit dans Ajout ou mise à jour d’URL ci-dessus.
    Inclure et exclure des masques de date
    Spécifiez des masques de date simples (chemin complet, chemin partiel ou chemins utilisant des caractères génériques ou des expressions régulières) ou incluez-les ou excluez-les.
    Le robot de recherche trouve et indexe ("inclure") ou ignore les documents ("exclure") en fonction de l’URL et de la date des documents.
    Vous pouvez utiliser les types de masques de date suivants :
    • include-days NNN
      Le robot de recherche indexe tous les documents qui correspondent au masque d’URL spécifié et qui datent au moins de plusieurs jours NNN.
      Vous pouvez suivre le masque d’URL avec un ou plusieurs des mots-clés suivants :
      • nofollow
      • noindex
      • server-date
      Par exemple, le masque suivant inclut tous les documents du dossier /archive/support qui ont 0 jour ou plus :
      include-days 0 https://www.mydomain.com/archive/support/
    • include-date AAAA-MM-JJ
      Le robot de recherche indexe tous les documents qui correspondent au masque d’URL spécifié et qui sont antérieurs ou antérieurs à la date AAAA-MM-JJ.
      Vous pouvez suivre le masque d’URL avec un ou plusieurs des mots-clés suivants :
      • nofollow
      • noindex
      • server-date
      L’exemple de masque suivant inclut tous les documents du dossier /archive/ daté du 25 juillet 2011 ou avant :
      include-date 2011-07-25 https://www.mydomain.com/archive/
    • exclude-days NNN
      Désactivez l’indexation de tous les documents qui correspondent au masque d’URL spécifié et qui datent de NNN jours ou plus.
      Vous pouvez éventuellement suivre le masque d’URL en fonction du mot-clé server-date .
      L’exemple de masque suivant exclut de votre index tous les fichiers PDF âgés de 90 jours ou plus :
      exclude-days 90 *.pdf
    • exclude-date AAAA-MM-JJ
      Désactivez l’indexation de tous les documents qui correspondent au masque d’URL spécifié et qui sont antérieurs ou antérieurs à la date AAAA-MM-JJ.
      Vous pouvez éventuellement suivre le masque d’URL en fonction du mot-clé server-date .
      L’exemple de masque suivant exclut tous les documents du dossier /archive/ daté du 23 avril 2004 ou avant :
      exclude-date 2004-04-23 https://www.mydomain.com/archive/
    Suppression d’URL
    Spécifiez des URL.
    Le robot de recherche trouve et supprime les documents spécifiés de l'index de recherche. Si une page spécifique figure déjà dans l'index de recherche, le robot la supprime avant d'ajouter ou de mettre à jour d'autres pages.
    Ce champ ne doit contenir que des URL de document et non des masques.
    Rechercher et supprimer des masques d’URL
    Spécifiez des masques d’URL simples (chemin complet, chemin partiel ou utilisant des caractères génériques ou des expressions régulières).
    Si le masque d’URL spécifié correspond aux pages de votre index de recherche, le robot de recherche supprime les pages avant d’ajouter ou de mettre à jour d’autres pages. Par exemple :
    https://www.mydomain.com/products/1998/household/*
    Vous pouvez également utiliser des expressions régulières, comme dans l’exemple suivant :
    regexp ^https://www\.mondomaine\.com/products/199[567]/.*$
  3. Cliquez sur Save Changes .
  4. (Facultatif) Effectuez l’une des opérations suivantes :

Définition de la planification de l’index incrémentiel pour un site Web en direct

Vous pouvez sélectionner la fréquence d’index incrémentiel et le temps de base utilisé pour analyser et mettre à jour votre index incrémentiel.
L’heure sélectionnée est locale en fonction du fuseau horaire configuré dans les Paramètres du compte.
Voir Configuration des paramètres de votre compte.
Les serveurs Web sont souvent programmés pour une maintenance en pleine nuit. Si votre serveur est en panne pendant une heure d’index planifiée, le processus d’indexation échoue. Veillez à sélectionner l’heure de la journée à laquelle votre serveur Web est disponible.
Le calendrier de l'index ne s'applique qu'à votre index en direct ; vous ne pouvez pas planifier des index par étapes.
Pour définir la planification de l’index incrémentiel pour un site Web en direct
  1. Dans le menu du produit, cliquez sur Index > Incremental Index > Live Schedule .
  2. Dans la Incremental Index Schedule page, dans la liste Incrementally Index déroulante, sélectionnez la fréquence d’indexation en heures ou en minutes.
  3. Dans la liste Base Time déroulante, sélectionnez l’heure de début de la régénération d’un nouvel index incrémentiel.
  4. Cliquez sur Save Changes .

Exécution d’un index incrémentiel d’un site Web en direct ou d’un site Web intermédiaire

Vous pouvez utiliser l’index incrémentiel pour indexer des "morceaux" de votre site Web en direct ou d’évaluation, comme une collection de pages fréquemment modifiées.
Pour exécuter un index incrémentiel d’un site Web en direct ou d’un site Web intermédiaire
  1. Dans le menu du produit, effectuez l’une des opérations suivantes :
    • Cliquez sur Index > Incremental Index > Live Index .
    • Cliquez sur Index > Incremental Index > Staged Index .
  2. Cliquez sur Incremental Index Now .
  3. (Facultatif) Si des erreurs d’indexation se sont produites, cliquez sur View Errors pour afficher le journal associé.

Affichage du journal d’index incrémentiel d’un site Web en direct ou d’un site Web intermédiaire

Lorsqu’un index incrémentiel actif ou un index incrémentiel intermédiaire est terminé, vous pouvez afficher le journal associé afin de résoudre les erreurs qui se sont produites.
Vous ne pouvez pas exporter de journaux ni les enregistrer. Le journal reste disponible jusqu’à ce que le nouvel index se produise.
Pour afficher le journal d’index incrémentiel d’un site Web en direct ou d’évaluation
  1. Dans le menu du produit, effectuez l’une des opérations suivantes :
    • Cliquez sur Index > Incremental Index > Live Log .
    • Cliquez sur Index > Incremental Index > Staged Log .
  2. Dans la page du journal, en haut ou en bas, effectuez l’une des opérations suivantes :
    • Utilisez les options de navigation First , Prev , Next , Last ou Go to line pour parcourir le journal.
    • Utilisez les options d’affichage Errors only , Wrap line ou Show pour affiner ce que vous voyez.