Show Menu
SUJETS×

A propos de l'index incrémentiel

Vous pouvez utiliser l’index incrémentiel pour indexer des "morceaux" de votre site Web réel ou d’évaluation, par exemple un ensemble de pages fréquemment modifiées.

Utilisation de l’index incrémentiel

Un index incrémentiel ne prend que quelques secondes et est utile sur les sites Web de grande capacité qui peuvent prendre plusieurs heures pour complètement indexer.
Lorsque vous générez un index incrémentiel, des informations d’état s’affichent, telles que l’heure de début, la durée écoulée et les erreurs survenues pendant le processus d’indexation. Des informations sur l’état de votre dernier index s’affichent également.
Vous pouvez arrêter ou redémarrer le processus d’indexation incrémentielle à tout moment.
Tandis que le nouvel index incrémentiel se développe pour votre site Web en direct, les clients peuvent continuer à rechercher votre site à l’aide de votre dernier index incrémentiel.

Configuration d’un index incrémentiel d’un site Web intermédiaire

Vous pouvez configurer les pages de site Web que vous souhaitez inclure dans votre index incrémentiel en spécifiant les URL de site Web et les masques d’URL.
Pour configurer un index incrémentiel d’un site Web intermédiaire
  1. Dans le menu produit, cliquez sur Index > Incremental Index > Configuration .
  2. Sur la Incremental Index Configuration page, utilisez les différents champs pour spécifier les pages à indexer.
    Champ
    Description
    ajouter ou mettre à jour des URL
    Spécifiez les URL.
    Le robot de recherche indexe uniquement les documents spécifiés qui ont changé depuis la dernière indexation.
    De plus, le robot de recherche suit les liens contenus dans les documents et index spécifiés uniquement les documents qui ont changé.
    Ce champ doit contenir des URL de document uniquement et non des masques, comme dans l’exemple suivant :
    https://www.mydomain.com/products/new.html
    Vous pouvez utiliser les mots-clés suivants avec l’URL :
    • noindex
      Si vous ne souhaitez pas indexer le texte de la page correspondant à une URL spécifiée, mais que vous souhaitez suivre les liens de la page, ajoutez noindex après l’URL comme dans l’exemple suivant :
      https://www.mydomain.com/products/new.html noindex
      Assurez-vous de séparer noindex l’URL avec un espace ; une virgule n'est pas un séparateur valide.
    • nofollow
      Si vous souhaitez indexer le texte de la page correspondant à l’URL spécifiée, mais que vous ne souhaitez pas suivre les liens de la page, ajoutez nofollow après l’URL, comme dans l’exemple suivant :
      https://www.mydomain.com/products/new.html nofollow
      Assurez-vous de séparer nofollow l’URL avec un espace ; une virgule n'est pas un séparateur valide.
    Rechercher et mettre à jour des masques d’URL
    Spécifiez des masques d’URL simples (chemin complet, chemin partiel ou chemins utilisant des caractères génériques ou des expressions régulières).
    Le robot de recherche ne trouve tous les documents et index correspondants que les documents qui ont changé depuis la dernière indexation.
    De plus, le robot de recherche suit les liens contenus dans les documents et index correspondants uniquement les pages qui ont changé. Par exemple :
    https://www.mydomain.com/products/household/*.html
    Vous pouvez également utiliser des expressions régulières, comme dans l’exemple suivant :
    regexp ^https://www\.mydomain\.com/products/household/.*\.html$
    Vous pouvez également utiliser les mots-clés nofollow et noindex comme décrit dans Ajouter ou Mettre à jour les URL ci-dessus.
    Inclure et exclure les masques d’URL
    Spécifiez des masques d’URL simples à inclure ou à exclure (chemin complet, chemin partiel ou chemins utilisant des caractères génériques ou des expressions régulières).
    Le robot de recherche trouve et indexe ("include") ou ignore ("exclude") les documents en fonction du type de masque spécifié.
    Lors de l’indexation d’un site, les directions sont suivies par ordre d’apparition. Par exemple, la liste de masques suivante :
    include https://www.mydomain.com/products/household/lightbulbs*.html
    exclude https://www.mydomain.com/products/
    indexe les pages lightbulbs1.html et lightbulbs2.html . Toutefois, il n’indexe aucune autre page répertoriée sous le répertoire products.
    Un masque d’URL qui s’affiche en premier a toujours priorité sur un masque qui s’affiche plus loin dans la liste. De plus, si le robot de recherche rencontre un document qui correspond à la fois à un masque d’inclusion et à un masque d’exclusion, le masque répertorié en premier est prioritaire.
    Vous pouvez également utiliser les mots-clés nofollow et noindex comme décrit dans Ajouter ou Mettre à jour les URL ci-dessus.
    Inclure et exclure des masques de date
    Spécifiez des masques de date simples à inclure ou à exclure (chemin complet, chemin partiel ou chemins utilisant des caractères génériques ou des expressions régulières).
    Le robot de recherche trouve et indexe ("include") ou ignore ("exclude") les documents en fonction de l’URL et de la date des documents.
    Vous pouvez utiliser les types de masques de date suivants :
    • include-days NNN
      Le robot de recherche indexe tous les documents qui correspondent au masque d'URL spécifié et qui sont âgés de NNN ou plus.
      Vous pouvez suivre le masque d’URL avec un ou plusieurs des mots-clés suivants :
      • nofollow
      • noindex
      • server-date
      Par exemple, le masque suivant inclut tous les documents du dossier /archive/support qui sont âgés de 0 jour ou plus :
      include-days 0 https://www.mydomain.com/archive/support/
    • include-date YYYY-MM-DD
      Le robot de recherche indexe tous les documents qui correspondent au masque d’URL spécifié et qui sont plus anciens ou plus anciens que la date AAAA-MM-JJ.
      Vous pouvez suivre le masque d’URL avec un ou plusieurs des mots-clés suivants :
      • nofollow
      • noindex
      • server-date
      L’exemple de masque suivant inclut tous les documents du dossier /archive/ daté du 25 juillet 2011 ou avant :
      include-date 2011-07-25 https://www.mydomain.com/archive/
    • exclude-days NNN
      Désactivez l’indexation de tous les documents qui correspondent au masque d’URL spécifié et qui sont de NNN jours ou plus anciens.
      Vous pouvez éventuellement suivre le masque d’URL en fonction du mot-clé server-date .
      L’exemple de masque suivant exclut de votre index tous les fichiers PDF âgés de 90 jours ou plus :
      exclude-days 90 *.pdf
    • exclude-date YYYY-MM-DD
      Désactivez l’indexation de tous les documents qui correspondent au masque d’URL spécifié et qui sont aussi anciens ou plus anciens que la date AAAA-MM-JJ.
      Vous pouvez éventuellement suivre le masque d’URL en fonction du mot-clé server-date .
      L’exemple de masque suivant exclut tous les documents du dossier /archive/ daté du 23 avril 2004 ou avant :
      exclude-date 2004-04-23 https://www.mydomain.com/archive/
    Suppression d’URL
    Spécifiez les URL.
    Le robot de recherche trouve et supprime les documents spécifiés de votre index de recherche. Si une page spécifiée figure déjà dans votre index de recherche, le robot la supprime avant d’ajouter ou de mettre à jour d’autres pages.
    Ce champ ne doit contenir que des URL de document et non des masques.
    Rechercher et supprimer des masques d’URL
    Spécifiez des masques d’URL simples (chemin complet, chemin partiel ou des masques utilisant des caractères génériques ou des expressions régulières).
    Si le masque d'URL spécifié correspond aux pages de votre index de recherche, le robot de recherche supprime les pages avant d'ajouter ou de mettre à jour d'autres pages. Par exemple :
    https://www.mydomain.com/products/1998/household/*
    Vous pouvez également utiliser des expressions régulières, comme dans l’exemple suivant :
    regexp ^https://www\.mydomain\.com/products/199[567]/.*$
  3. Cliquez sur Save Changes .
  4. (Facultatif) Effectuez l’une des opérations suivantes :

Définition de la planification de l’index incrémentiel pour un site Web en direct

Vous pouvez sélectionner la fréquence d’index incrémentiel et la durée de base utilisée pour analyser et mettre à jour votre index incrémentiel.
L’heure sélectionnée est locale en fonction du fuseau horaire configuré dans les Paramètres du compte.
Voir Configuration des paramètres de votre compte.
Les serveurs Web sont souvent programmés pour une maintenance en pleine nuit. Si votre serveur est hors service pendant une heure d'indexation planifiée, le processus d'indexation échoue. Veillez à sélectionner l’heure de la journée à laquelle votre serveur Web est disponible.
Le calendrier de l'index ne s'applique qu'à votre index de production ; vous ne pouvez pas planifier des index par étapes.
Pour définir la planification de l’index incrémentiel pour un site Web en direct
  1. Dans le menu produit, cliquez sur Index > Incremental Index > Live Schedule .
  2. Dans la Incremental Index Schedule page, dans la liste Incrementally Index déroulante, sélectionnez la fréquence d’indexation en heures ou en minutes.
  3. Dans la liste Base Time déroulante, sélectionnez l’heure de début de la régénération d’un nouvel index incrémentiel.
  4. Cliquez sur Save Changes .

Exécution d’un index incrémentiel d’un site Web dynamique ou d’un site Web intermédiaire

Vous pouvez utiliser l’index incrémentiel pour indexer des "morceaux" de votre site Web réel ou d’évaluation, par exemple un ensemble de pages fréquemment modifiées.
Pour exécuter un index incrémentiel d’un site Web en direct ou par étape
  1. Dans le menu produit, effectuez l’une des opérations suivantes :
    • Cliquez sur Index > Incremental Index > Live Index .
    • Cliquez sur Index > Incremental Index > Staged Index .
  2. Cliquez sur Incremental Index Now .
  3. (Facultatif) Si des erreurs d’indexation se sont produites, cliquez sur View Errors pour vue le journal associé.

Affichage du journal d'index incrémentiel d'un site Web en direct ou d'un site Web intermédiaire

Lorsqu'un index incrémentiel actif ou un index incrémentiel intermédiaire est terminé, vous pouvez vue son journal associé pour résoudre les erreurs qui se sont produites.
Vous ne pouvez pas exporter de journaux ni les enregistrer. Le journal reste disponible pour affichage jusqu'à ce que le nouvel index se produise.
Pour vue du journal d'index incrémentiel d'un site Web dynamique ou d'un site Web intermédiaire
  1. Dans le menu produit, effectuez l’une des opérations suivantes :
    • Cliquez sur Index > Incremental Index > Live Log .
    • Cliquez sur Index > Incremental Index > Staged Log .
  2. Dans la page de journal, en haut ou en bas, effectuez l’une des opérations suivantes :
    • Utilisez les options de navigation First , Prev , Next Last ou Go to line pour parcourir le journal.
    • Utilisez les options d'affichage Errors only , Wrap line ou Show pour affiner ce que vous voyez.