Show Menu
ARGOMENTI×

Informazioni sull'indice incrementale

Potete utilizzare l'indice incrementale per indicizzare "parti" del sito Web dal vivo o sullo stage, ad esempio una raccolta di pagine modificate di frequente.

Utilizzo dell'indice incrementale

L'esecuzione di un indice incrementale richiede solo pochi secondi ed è utile su siti Web di grandi dimensioni che possono richiedere molte ore per eseguire l'indicizzazione completa.
Quando si genera un indice incrementale, vengono visualizzate informazioni sullo stato, ad esempio ora di inizio, tempo trascorso ed errori durante il processo di indicizzazione. Vengono visualizzate anche informazioni sullo stato dell'ultimo indice.
È possibile arrestare o riavviare il processo di indicizzazione incrementale in qualsiasi momento.
Mentre il nuovo indice incrementale viene creato per il sito Web live, i clienti possono continuare a cercare sul sito utilizzando l'ultimo indice incrementale.

Configurazione di un indice incrementale di un sito Web in fase

Potete configurare quali pagine Web includere nell’indice incrementale specificando gli URL del sito Web e le maschere URL.
Per configurare un indice incrementale di un sito Web in fase di progettazione
  1. Nel menu del prodotto, fate clic su Index > Incremental Index > Configuration .
  2. Nella Incremental Index Configuration pagina, utilizzare i vari campi per specificare le pagine da indicizzare.
    Campo
    Descrizione
    Aggiungere o aggiornare gli URL
    Specificate gli URL.
    Il robot di ricerca indicizza solo i documenti specificati che sono stati modificati dopo l’ultima indicizzazione.
    Inoltre, il robot di ricerca segue i collegamenti contenuti nei documenti specificati e indicizza solo i documenti che sono stati modificati.
    Questo campo deve contenere solo URL del documento e non maschere, come nell'esempio seguente:
    https://www.mydomain.com/products/new.html
    Con l’URL potete usare le seguenti parole chiave:
    • noindex
      Se non si desidera indicizzare il testo sulla pagina che corrisponda a un URL specificato, ma si desidera seguire i collegamenti della pagina, aggiungere noindex dopo l’URL come nell’esempio seguente:
      https://www.mydomain.com/products/new.html di indice
      Assicurati di separarti noindex dall’URL con uno spazio; una virgola non è un separatore valido.
    • nofollow
      Se desiderate indicizzare il testo nella pagina che corrisponde all'URL specificato, ma non desiderate seguire i collegamenti della pagina, aggiungete nofollow dopo l’URL come nell’esempio seguente:
      https://www.mydomain.com/products/new.html
      Assicurati di separarti nofollow dall’URL con uno spazio; una virgola non è un separatore valido.
    Trovare e aggiornare le maschere URL
    Specificate maschere URL semplici: percorso completo, percorso parziale o percorsi che utilizzano caratteri jolly o espressioni regolari.
    Il robot di ricerca trova tutti i documenti corrispondenti e indicizza solo i documenti modificati dall’ultima volta che è stato indicizzato.
    Inoltre, il robot di ricerca segue i collegamenti contenuti nei documenti corrispondenti e indicizza solo le pagine che sono state modificate. Ad esempio:
    https://www.mydomain.com/products/household/*.html
    È inoltre possibile utilizzare espressioni regolari come nell'esempio seguente:
    regexp ^https://www\.mydomain\.com/products/family/.*\.html$
    Consultate Espressioni regolari.
    È inoltre possibile utilizzare le parole chiave nofollow e noindex come descritto in Aggiungi o Aggiorna URL qui sopra.
    Includi ed Escludi maschere URL
    Specificate maschere URL semplici da includere o escludere: percorso completo, percorso parziale o percorsi che utilizzano caratteri jolly o espressioni regolari.
    Il robot di ricerca trova e indicizza ("include") o ignora i documenti ("exclude") in base al tipo di maschera specificato.
    Durante l'indicizzazione di un sito, le direzioni vengono seguite in ordine di aspetto. Ad esempio, il seguente elenco di maschere:
    includi https://www.mydomain.com/products/household/lightbulbs*.html
    exclude https://www.mydomain.com/products/
    indicizza le pagine lightbulbs1.html e lightbulbs2.html . Tuttavia, non indicizza altre pagine elencate nella directory products.
    Una maschera URL visualizzata per prima ha sempre la precedenza su una visualizzata successivamente nell’elenco. Inoltre, se il robot di ricerca rileva un documento che corrisponde sia a una maschera di inclusione che a una maschera di esclusione, la maschera elencata per prima ha la precedenza.
    È inoltre possibile utilizzare le parole chiave nofollow e noindex come descritto in Aggiungi o Aggiorna URL qui sopra.
    Consultate Le Maschere URL.
    Includi ed Escludi maschere di data
    Specificate maschere di data di inclusione o esclusione semplici, ovvero percorso completo, percorso parziale o percorsi che utilizzano caratteri jolly o espressioni regolari.
    Il robot di ricerca trova e indicizza ("include") o ignora i documenti ("exclude") in base sia all'URL che alla data dei documenti.
    Potete utilizzare i seguenti tipi di maschere data:
    • includi giorni NNN
      Il robot di ricerca indicizza tutti i documenti che corrispondono alla maschera URL specificata e che sono giorni NNN o più vecchi.
      Potete seguire la maschera URL con una o più delle seguenti parole chiave:
      • nofollow
      • noindex
      • data server
      Ad esempio, la seguente maschera include tutti i documenti presenti nella cartella /archive/support che sono di 0 giorni o più:
      include-Days 0 https://www.mydomain.com/archive/support/
    • include data AAAA-MM-GG
      Il robot di ricerca indicizza tutti i documenti che corrispondono alla maschera URL specificata e che hanno la stessa data o meno recente della data AAAA-MM-GG.
      Potete seguire la maschera URL con una o più delle seguenti parole chiave:
      • nofollow
      • noindex
      • data server
      L'esempio di maschera seguente include tutti i documenti presenti nella cartella /archive/ datata 25 luglio 2011 o precedente:
      include-date 2011-07-25 https://www.mydomain.com/archive/
    • exclude-Days NNN
      Disattivate l’indicizzazione di tutti i documenti che corrispondono alla maschera URL specificata e che hanno una durata pari o superiore a NNN giorni.
      Facoltativamente, potete seguire la maschera URL tramite la parola chiave data server .
      L’esempio di maschera seguente esclude dall’indice tutti i file PDF vecchi o precedenti di 90 giorni:
      exclude-Days 90 *.pdf
    • exclude-date YYYY-MM-DD
      Disattivate l’indicizzazione di tutti i documenti che corrispondono alla maschera URL specificata e che hanno la stessa data o meno della data AAAA-MM-GG.
      Facoltativamente, potete seguire la maschera URL tramite la parola chiave data server .
      L'esempio di maschera seguente esclude tutti i documenti presenti nella cartella /archive/ con data del 23 aprile 2004 o precedente:
      exclude-date 2004-04-23 https://www.mydomain.com/archive/
    Consultate Le Maschere Data.
    Eliminare gli URL
    Specificate gli URL.
    Il robot di ricerca trova ed elimina i documenti specificati dall'indice di ricerca. Se una pagina specifica è già nell’indice di ricerca, il robot la elimina prima di aggiungere o aggiornare altre pagine.
    Questo campo deve contenere solo URL del documento e non maschere.
    Trovare ed eliminare maschere URL
    Specificate maschere URL semplici: percorso completo, percorso parziale o maschere che utilizzano caratteri jolly o espressioni regolari.
    Se la maschera URL specificata corrisponde alle pagine nell’indice di ricerca, il robot di ricerca elimina le pagine prima di aggiungere o aggiornare altre pagine. Ad esempio:
    https://www.mydomain.com/products/1998/household/*
    È inoltre possibile utilizzare espressioni regolari come nell'esempio seguente:
    regexp ^https://www\.mydomain\.com/products/199[567]/.*$
    Consultate Espressioni regolari.
  3. Clic Save Changes .
  4. (Facoltativo) Effettuate una delle seguenti operazioni:

Impostazione della pianificazione dell'indice incrementale per un sito Web live

Potete selezionare la frequenza dell'indice incrementale e il tempo di base utilizzati per eseguire ricerche per indicizzazione e aggiornare l'indice incrementale.
L'ora selezionata è locale in base al fuso orario configurato in Impostazioni account.
Consultate Configurazione delle impostazioni dell’account.
I server Web sono spesso programmati per la manutenzione nel bel mezzo della notte. Se il server è inattivo durante un periodo di tempo di indicizzazione pianificato, il processo di indicizzazione non riuscirà. Accertatevi di selezionare un'ora del giorno in cui il server Web sarà disponibile.
La pianificazione dell'indice si applica solo all'indice live; non è possibile pianificare indici in fase.
Per impostare la pianificazione incrementale dell'indice per un sito Web live
  1. Nel menu del prodotto, fate clic su Index > Incremental Index > Live Schedule .
  2. Nella Incremental Index Schedule pagina dell’elenco a Incrementally Index discesa, selezionare la frequenza di indicizzazione in ore o minuti.
  3. Nell'elenco a Base Time discesa, selezionare l'ora di inizio per la rigenerazione di un nuovo indice incrementale.
  4. Clic Save Changes .

Esecuzione di un indice incrementale di un sito Web live o in uno stage

Potete utilizzare l'indice incrementale per indicizzare "parti" del sito Web dal vivo o sullo stage, ad esempio una raccolta di pagine modificate di frequente.
Per eseguire un indice incrementale di un sito Web attivo o in fase
  1. Nel menu del prodotto, effettuate una delle seguenti operazioni:
    • Fai clic su Index > Incremental Index > Live Index .
    • Fai clic su Index > Incremental Index > Staged Index .
  2. Clic Incremental Index Now .
  3. (Facoltativo) In caso di errori di indicizzazione, fare clic View Errors per visualizzare il registro associato.

Visualizzazione del registro dell'indice incrementale di un sito Web live o in una fase

Quando un indice incrementale dinamico o un indice incrementale in fase è completo, potete visualizzare il registro associato per risolvere eventuali errori che si sono verificati.
Non è possibile esportare i file di registro né salvarli. Il registro rimane disponibile per la visualizzazione fino a quando non si verifica il nuovo indice.
Per visualizzare il registro dell'indice incrementale di un sito Web attivo o in fase di esecuzione
  1. Nel menu del prodotto, effettuate una delle seguenti operazioni:
    • Fai clic su Index > Incremental Index > Live Log .
    • Fai clic su Index > Incremental Index > Staged Log .
  2. Nella pagina di registro, in alto o in basso, effettuate una delle seguenti operazioni:
    • Utilizzate le opzioni di navigazione First , Prev , Next , Last o Go to line per spostarsi nel registro.
    • Utilizzate le opzioni di visualizzazione Errors only , Wrap line o Show per perfezionare il contenuto visualizzato.