Show Menu
ARGOMENTI×

Domande frequenti

Quando si esegue la ricerca per indicizzazione e la ricerca per indicizzazione di un file SWF?

Un file SWF viene sottoposto a ricerca per indicizzazione e indicizzazione se è contenuto in un tag embed o object in una pagina HTML, come nell'esempio seguente:
<embed src="Flash-file-URL">  
 
<object>  
<param name=movie value="Flash-file-URL">  
</object> 

Un file SWF viene riconosciuto anche se l’URL del file è elencato come punto di ingresso.

Cosa devo fare per indicizzare un file SWF?

Per eseguire la ricerca per indicizzazione e indicizzare i file SWF, selezionate il tipo di contenuto Adobe Flash Movies ( Settings > Crawling > Content Types ).
Fintanto che al file Flash viene fatto riferimento da un <embed> tag o un <object> tag in un documento HTML, il testo viene indicizzato e tutti gli URL elencati nel file vengono sottoposti a ricerca per indicizzazione.
Se al file non viene fatto riferimento da un <embed> tag o da un <object> tag, potete elencare il file SWF in un <a href=...> tag in un documento HTML o come punto di ingresso dell’URL.

Come vengono riconosciuti i file SWF?

I file SWF sono identificati dal seguente tipo MIME:
application/x-shockwave-flash
I file SWF sono riconosciuti anche con tipi application/octet-stream " o text/plain MIME, a condizione che l'estensione sia .swf.
Un server non configurato correttamente potrebbe utilizzare un tipo MIME diverso per i file SWF. Accertatevi di controllare la configurazione del server in caso di problemi di ricerca per indicizzazione e indicizzazione dei file SWF.

Come vengono indicizzati i file SWF?

Il testo contenuto in un file SWF è indicizzato come se fosse <body> testo nella pagina HTML di inclusione. Se un risultato della ricerca trova testo contenuto in un file SWF incorporato, il risultato effettivamente collega alla pagina HTML di cui fa parte e non al file SWF. In questo modo, il file SWF viene visualizzato nel contesto corretto.
Se un file SWF contiene un URL come azione "Carica filmato", il testo nel file SWF a cui viene fatto riferimento viene indicizzato come parte della pagina HTML di cui fa riferimento.
Se un file SWF contiene un URL come azione "Ottieni URL", l’URL viene sottoposto a ricerca per indicizzazione in un secondo momento, proprio come un riferimento HTML <a href=...> viene sottoposto a ricerca per indicizzazione in un secondo momento.
Se un file SWF è elencato come punto di ingresso URL, il testo del file SWF viene indicizzato come una singola pagina. Un risultato di ricerca che trova testo da un collegamento SWF punto di ingresso direttamente al filmato, non a una pagina HTML di inclusione.

Un file SWF viene conteggiato come pagina?

No. Un file SWF è considerato parte della relativa pagina HTML di inclusione. Tutti gli URL "Carica filmato" contenuti nei file SWF sono considerati anche parte della pagina HTML di inclusione. Pertanto, i file SWF a cui viene fatto riferimento da una pagina HTML non vengono conteggiati come "pagina" per il totale di pagina dell'account.
Se un file SWF è elencato come punto di ingresso dell'URL, tale file SWF e tutti gli URL "Carica filmato" elencati in tale file SWF vengono conteggiati come una "pagina" per il totale della pagina dell'account.

Come posso impedire l'indicizzazione di singoli file SWF?

Per impedire l’indicizzazione di un file SWF, al documento HTML di cui fa parte potete aggiungere un tag meta ( <meta name="ROBOTS" content="NOINDEX"> ) o un <noindex> tag . Ovvero, il documento che contiene il <embed> tag o <object> .
Potete anche usare il tag meta ( <meta name="ROBOTS" content="NOFOLLOW"> ) robot per impedire che i seguenti URL siano contenuti nel file SWF. Se il documento HTML di cui fa parte è disattivato, le azioni "Ottieni URL" elencate nel file SWF non vengono seguite.

Come posso impedire che i file SWF vengano indicizzati sul mio sito Web?

Per disattivare l'indicizzazione SWF, deselezionare il tipo di contenuto Adobe Flash Movies ( Settings > Crawling > Content Types ).
Potete anche scegliere di disattivare URL Masks l’indicizzazione dei file SWF.
Per disattivare l’indicizzazione SWF, immettete una delle seguenti maschere URL:
  • exclude *.swf (se non si utilizzano espressioni regolari)
  • exclude regexp ^.*\.swf$ (se utilizzate espressioni regolari)

Com'è possibile che non sia possibile effettuare ricerche nei file SWF cinesi, giapponesi o coreani sul sito Web?

La ricerca nel sito/merchandising ottiene l’UTF-8 dai file SWF creati con Adobe Flash. L'UTF-8 non contiene alcuna indicazione di lingua. Se avete selezionato il tipo di contenuto Adobe Flash Movies ( Settings > Crawling > Content Types ), dovete usare le iniezioni di metadati per specificare la lingua utilizzata dal file SWF.
Vedere Aggiunta di definizioni di iniezione di campi.
I file SWF precedenti non specificano neanche un set di caratteri. Se è stato selezionato il tipo di contenuto SWF Adobe Flash Movies ( Settings > Crawling > Content Types ), è necessario utilizzare i metadati Iniezioni per specificare il set di caratteri utilizzato nel file SWF.

Ricerca generale

Una pagina di domande frequenti in cui viene spiegato in che modo la ricerca del sito/merchandising aiuta i clienti che visitano il sito Web a trovare le informazioni che stanno cercando.
Di seguito sono riportate alcune domande comuni relative alla ricerca generale:
Seguono alcune domande comuni sulle funzioni di ricerca:

Devo installare un software per utilizzare la ricerca del sito/merchandising?

No. Questo è il vantaggio principale della ricerca del sito/merchandising. Il motore è un'applicazione professionale ospitata e mantenuta interamente sui nostri server ad alte prestazioni. Questo rende il software più facile da usare di altre soluzioni di ricerca. L’unica cosa da fare è aggiungere una piccola quantità di codice HTML alle pagine in modo che i clienti del sito Web possano inserire delle ricerche. Ricerca nel sito/merchandising si occupa di tutto il resto.

Cosa succede quando il sito supera il limite di pagine?

Continuiamo a servire le tue ricerche in modo che i visitatori possano cercare il tuo sito Web senza interruzioni. Per verificare se il sito Web supera il limite di pagine, controlla il tuo stato Indice completo o Registro dal vivo.
Consultate L’indice completo.

Come posso cambiare l'indirizzo e-mail in cui vengono inviati i rapporti settimanali?

I rapporti settimanali vengono inviati al proprietario di ciascun account attivo. Potete cambiare l’indirizzo e-mail facendo clic su Settings > My Profile > Personal Information . Se disponete di più account di ricerca attivi, tutte le newsletter vengono inviate al nuovo indirizzo.
Consultate Configurazione delle informazioni utente personali.

Quanto sono sicure le informazioni del cliente sulla ricerca del sito/merchandising?

Ricerca e merchandising sul sito sono sicuri, veloci, stabili e facili da usare. Non sei obbligato a utilizzare i cookie (anche se puoi farlo se vuoi) per i nostri prodotti, e le informazioni riservate, come le password, non vengono mai messe su alcun collegamento URL che possa essere successivamente recuperato dal tuo browser.

E la privacy delle informazioni sui clienti?

Adobe si impegna a rispettare la privacy dei propri clienti e visitatori. Consultate il Centro per la privacy di Adobe.

Posso mostrare i miei banner pubblicitari sulle pagine dei risultati della ricerca?

Sì. Potete controllare l’aspetto e il contenuto dei risultati della ricerca. All’interno del modello di risultati della ricerca per il sito Web, potete creare collegamenti alla vostra rete di scambio banner, ad esempio LinkExchange o SmartClicks. Eventuali hit effettuati dai visitatori vengono correttamente accreditati sul vostro account di scambio banner.

È possibile personalizzare i risultati della ricerca per il sito?

Sì. Questa è una funzione esclusiva di ricerca del sito/merchandising. Grazie alla nostra tecnologia avanzata per i modelli e alla poca conoscenza di HTML, potete controllare esattamente come vengono visualizzati i risultati della ricerca.
Consultate Cercare i tag dei modelli.
La transizione tra i propri server e i server di ricerca/merchandising del sito è completamente invisibile per i clienti. Se non conoscete l’HTML o non avete il tempo di creare un modello personalizzato, potete scegliere tra un assortimento di modelli attraenti e pronti all’uso creati dal team interno di sviluppatori Web professionisti di Adobe.

Posso vedere quali clienti stanno cercando sul mio sito?

Sì. Teniamo le statistiche di ricerca per le ricerche effettuate dai visitatori sul tuo sito Web negli ultimi due mesi. Potete esaminare queste statistiche in qualsiasi momento in Rapporti nel menu del prodotto. I rapporti di ricerca forniscono informazioni vitali riguardo esattamente ciò che i visitatori cercano sul sito Web. Potete utilizzare queste informazioni per migliorare la progettazione o per ottimizzare il motore di ricerca/merchandising del sito in modo da soddisfare meglio i visitatori.

Come è possibile controllare quali tipi di contenuto (PDF, testo, Flash, MP3 e Microsoft Office) vengono indicizzati e cercati?

È possibile configurare facilmente gli account per attivare o disattivare l'indicizzazione e la ricerca del testo contenuto nei documenti PDF, nei documenti di testo normale, nei filmati Flash, nei file MP3 o nei documenti di Microsoft Office.
Queste impostazioni sono controllate sulla Staged Content Types pagina.
Consultate I Tipi Di Contenuto.

Sono supportate pagine Web generate dinamicamente tramite contenuti basati su ASP, JSP, PHP, CFM o Perl?

Le pagine Web HTML statiche o generate dinamicamente sono indicizzate, comprese le pagine create da database o qualsiasi altro processo back-end. Poiché il codice HTML visualizzato da un browser è indicizzato, potete utilizzare la ricerca nel sito/merchandising sui siti Web purché queste architetture back-end producano risultati in pagine HTML.
Il robot di ricerca passa per il sito Web iniziando dalla prima pagina all'indirizzo del sito Web specificato in Account Settings, e segue i collegamenti da una pagina all'altra.
Consultate Configurazione delle impostazioni dell’account.
Quando il robot di ricerca si aggancia e indicizza tutte le pagine del tuo sito web, allora puoi usare il motore di ricerca per cercare il tuo sito. In altre parole, se nel sito Web sono collegati documenti generati dinamicamente con collegamenti provenienti da altre pagine, il robot di ricerca può comunque eseguire ricerche per indicizzazione e indicizzare il contenuto dinamico.
Una volta che il contenuto del sito Web è sottoposto a ricerca per indicizzazione e ricerca per indicizzazione, i clienti possono cercare informazioni all’interno del contenuto indicizzato.

Come posso utilizzare i sinonimi per migliorare i risultati della ricerca per il mio sito?

È possibile utilizzare i sinonimi quando si desidera che i visitatori trovino pagine correlate alla query di ricerca.
Ad esempio, supponete di avere una pagina contenente un listino prezzi dei prodotti in vendita sul sito. Tuttavia, dopo aver esaminato i report di ricerca forniti dalla ricerca del sito/merchandising, si scopre che i clienti cercano nella ricerca la parola "costo", "spesa", "addebito" o "tassa". Queste parole non visualizzano la pagina del listino prezzi nei risultati della ricerca. Con la Add Synonyms funzione in Dictionaries, è possibile specificare che queste parole sono tutti sinonimi, e il cliente può trovare il proprio listino prezzi, indipendentemente dal termine utilizzato.

Posso controllare l'ordine dei risultati della ricerca?

Sì. Utilizzando l'interfaccia di rilevanza avanzata, è possibile controllare le pagine restituite per una specifica query di ricerca. Questa funzione è utile se desiderate essere certi che i clienti visualizzino una pagina specifica quando effettuano una query per determinate parole.
Consultate Aggiunta di un nuovo campo tag meta.

È possibile modificare la lingua della pagina dei risultati della ricerca?

Sì. Il modello di ricerca del sito/merchandising è flessibile quando si tratta di consentire di creare una pagina di risultati che utilizza la lingua desiderata e che corrisponde all’aspetto del sito Web.
Il modello è costituito da una combinazione di testo, tag HTML standard e tag speciali definiti per visualizzare i risultati della ricerca. Quando un cliente esegue una ricerca, il robot di ricerca legge il modello, genera il testo utilizzando tag HTML standard e inserisce i collegamenti dei risultati in base ai tag modello speciali.
Consultate Cercare i tag dei modelli.
Se desiderate modificare la lingua dei risultati, potete modificare il testo in inglese che appare sul modello.

Posso avere più di un sito sul mio Adobe Customer Login?

Sì. Con un singolo accesso cliente Adobe, potete gestire un motore di ricerca diverso per molti siti Web diversi. Seleziona e gestisci gli account in "Account".

Posso eseguire la ricerca in più domini?

Sì. Puoi configurare l'accesso a più domini utilizzando URL Entrypoints. Immetti i punti di ingresso URL per altri domini di tua proprietà. Ricorda che devi disporre dell'autorizzazione per indicizzare domini che non possiedi.
Consultate I punti di ingresso URL.

È possibile suddividere il sito in sezioni distinte in modo che i clienti possano eseguire una ricerca in una di queste aree singolarmente o in tutto il sito?

Sì. È inclusa una funzione "Raccolte" che consente ai clienti di cercare aree specifiche del sito Web per trovare rapidamente ciò che stanno cercando.
Consultate Le Raccolte .
Ad esempio, i clienti possono cercare una raccolta di URL relativi alle informazioni di vendita del prodotto o una raccolta di URL relativi ai servizi di supporto. Potete impostare le raccolte in modo che i clienti visualizzino un elenco a discesa di raccolte o un gruppo di caselle di controllo.

Come si esclude la ricerca di parti del sito Web?

Sì. Specificate le maschere URL per determinare quali pagine Web includere o escludere dall’indicizzazione. Le maschere URL determinano se nei risultati di ricerca vengono visualizzate le pagine del sito Web.
Consultate Le maschere URL.
Consultate Lo script delle maschere URL.
Per impedire la ricerca di parti di singole pagine Web, è possibile escludere parti di una pagina dall’indicizzazione. Circondare il testo con <noindex> tag e </noindex> tag. Questo metodo è utile per escludere il testo di navigazione dalle ricerche.

Quali set di caratteri sono supportati?

Le pagine Web in genere specificano il set di caratteri con un tag meta simile al seguente:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
Il motore di ricerca del sito/merchandising indicizza correttamente le pagine Web utilizzando tutti i set di caratteri comuni attualmente in uso su Internet. Alcuni dei set di caratteri supportati includono quanto segue:
Arabo (ISO-8859-6)
Cinese (tradizionale; Big5)
Giapponese (Shift_JIS)
Arabo (Windows-1256)
Cinese (tradizionale; EUC-TW)
Russo (KOI8-R)
Baltico (ISO-8859-4)
Cirillico (ISO-8859-5)
Europa meridionale (ISO-8859-3)
Baltico (Windows-1257)
Cirillico (Windows-1251)
Turco (ISO-8859-9)
Europa centrale (ISO-8859-2)
Greco (ISO-8859-7)
Turco (Windows-1254)
Europa centrale (Windows-1250)
Greco (Windows-1253)
Unicode (UTF-8)
Cinese (ISO-2022-CN)
Ebraico (ISO-8859-8)
US-ASCII (us-ascii)
Cinese (ISO-2022-CN-EXT)
Ebraico (Windows-1255)
Europa occidentale (ISO-8859-1)
Cinese (semplificato; EUC-CN)
Giapponese (EUC-JP)
Europa occidentale (ISO-8859-15)
Cinese (semplificato; GB2312)
Giapponese (ISO-2022-JP)
Europa occidentale (Windows-1252)
Cinese (semplificato; GBK)
Giapponese (ISO-2022-JP-1)
Europa occidentale (x-mac-roman)
Cinese (semplificato; (HZ-GB-2312)
Giapponese (ISO-2022-JP-2)
Per informazioni sui set di caratteri non elencati sopra, contattate il supporto tecnico.

Cosa succede se si modifica o si aggiorna il sito Web?

Dopo aver modificato il contenuto del sito Web, potete eseguire un indice completo o un indice incrementale. Consente di scaricare e indicizzare i contenuti dei siti Web modificati mediante la ricerca nel sito/merchandising. Al termine dell’indicizzazione, i clienti possono effettuare ricerche nel nuovo contenuto. Potete anche pianificare un'indicizzazione automatica del sito in un determinato momento e in un giorno specifico.

È possibile indicizzare automaticamente il sito?

Sì. Potete pianificare un indice automatico del sito ogni giorno.
Oltre all'indicizzazione automatica giornaliera, è possibile scegliere di aver modificato frequentemente porzioni del sito indicizzate in modo incrementale. Nei giorni in cui è pianificato un indice automatico, potete controllare l'ora del giorno in cui ha luogo l'indice. Inoltre, potete sempre avviare manualmente un indice del sito ogni volta che lo desiderate.

Io uso delle password sul mio sito web. Posso ancora utilizzare la ricerca nel sito/merchandising?

Se utilizzate l'autenticazione di base HTTP per proteggere con password determinate porzioni del sito Web, potete specificare aree di autenticazione e password che la ricerca o il merchandising del sito possono utilizzare per indicizzare il sito.

Supportate la ricerca per indicizzazione e l'indicizzazione di https o contenuto server protetto?

Sì. È possibile eseguire ricerche per indicizzazione e indicizzazione del contenuto sui server protetti (https).

La ricerca del sito/merchandising rispetta il file robots.txt sul mio sito Web?

Sì. Il protocollo di esclusione dei robot è conforme. Il robot di ricerca esamina il file robots.txt se è presente sul vostro sito web. Se il file robots.txt esclude tutti i robot dalla ricerca per indicizzazione del sito, viene escluso anche il robot di ricerca/merchandising del sito. Per consentire solo al robot di ricerca del sito/merchandising di eseguire la ricerca per indicizzazione del sito, impostate il contenuto del file robots.txt su quanto segue:
User-agent: Atomz/1.0 
Disallow:

User-agent: * 
Disallow: /

Per ulteriori informazioni sui robot web e sul protocollo di esclusione dei robot, consulta:

Alcune parti del mio sito Web devono essere aggiornate frequentemente in modo che i miei clienti ottengano i risultati di ricerca più precisi. L'indicizzazione incrementale è utile in questo caso?

Sì. Questo scenario è il risultato della funzione di indicizzazione incrementale creata per facilitare la ricerca nel sito/merchandising. Il vantaggio principale dell'indicizzazione incrementale è che consente alle aziende di indicizzare frequentemente parti del sito Web che cambiano dinamicamente. Questa funzionalità assicura che i risultati della ricerca vengano visualizzati con precisione "fino al minuto".

Le pagine Web generate dinamicamente sono supportate da un database back-end, come cataloghi di prodotti o sistemi di gestione delle scorte?

Le pagine Web HTML statiche o generate dinamicamente, incluse le pagine create da database o qualsiasi altro processo back-end, sono indicizzate. Poiché il codice HTML, visualizzato da un browser, è indicizzato, potete utilizzare la ricerca nel sito/merchandising sui siti Web purché le informazioni del database di back-end si traducano in pagine HTML.
Il robot di ricerca passa per il sito Web iniziando dalla prima pagina all'indirizzo del sito Web specificato in Account Settings, e segue i collegamenti da una pagina all'altra.
Consultate Configurazione delle impostazioni dell’account.
Quando il robot di ricerca si aggancia e indicizza tutte le pagine del tuo sito web, allora puoi usare il motore di ricerca per cercare il tuo sito. In altre parole, se nel sito Web sono collegati documenti generati dinamicamente con collegamenti provenienti da altre pagine, il robot di ricerca può comunque eseguire ricerche per indicizzazione e indicizzare il contenuto del database dinamico.
Una volta che il contenuto del sito Web è sottoposto a ricerca per indicizzazione e ricerca per indicizzazione, i clienti possono cercare informazioni all’interno del contenuto indicizzato.
Potete facilmente abilitare la ricerca per contenuti completi o una ricerca basata su argomenti più ristretta, limitata alle informazioni contenute nel titolo, nella meta-descrizione, nei tag del documento delle parole chiave meta o in tutti e tre i tag. Utilizzando le definizioni dei metadati, potete anche creare campi di visualizzazione personalizzati, come un'immagine di prodotto, nei risultati effettivi della ricerca.
Consultate Aggiunta di un nuovo campo tag meta.

È possibile utilizzare script o programmi per avviare un indice incrementale del sito?

Sì. È possibile utilizzare script o programmi per avviare un indice incrementale del sito Web, nonché per eseguire il ping dei server per indicizzare il sito ogni volta che il contenuto viene modificato o aggiornato.
Vedere Informazioni sull'indice con script.

Implementazioni delle funzioni

Una pagina di domande frequenti in cui vengono illustrate le diverse implementazioni delle funzioni in Search&Promote.
Seguono alcune domande comuni relative alle implementazioni di funzionalità in Search&Promote un sito Web:

Perché le mie regole aziendali non sono in esecuzione?

Configurate le regole di business quando vengono visualizzati i banner o per determinare quali risultati vengono visualizzati e in quale ordine. Potete anche configurare la posizione di un elemento nel facet e il modello da usare per una determinata ricerca. Riordinate le regole business per modificare l'ordine in cui vengono eseguite sui modelli di presentazione. Le regole aziendali vengono eseguite nell'ordine in cui sono state definite; ossia, più alto è il numero dell'ordine di una regola, più tardi verrà eseguito nel processo, superando le regole precedenti. Riordinare le regole immettendo un nuovo numero nella colonna Ordine della tabella nella pagina Regole business.
Vedere Informazioni sulle regole aziendali.

Perché si verificano problemi durante la programmazione dell'indicizzazione, errori durante l'avvio dell'indicizzazione e problemi durante l'avvio dell'indicizzazione in fase?

Quando si genera un indice, pieno o incrementale, le informazioni sullo stato di ricerca per indicizzazione vengono visualizzate in tempo reale. Ad esempio, potete visualizzare il tempo di inizio, il tempo trascorso e tutti gli errori che si sono verificati durante il processo di indicizzazione. Vengono visualizzate anche informazioni sullo stato dell'ultimo indice. Utilizzate queste informazioni per risolvere eventuali errori di indicizzazione riscontrati.

Il limite di dimensione dell'indice supera il limite consentito. Perché sta accadendo e come lo riparo?

Un sito Web può tendere a crescere e nel tempo Search&Promote "scopre" più documenti e pagine Web che sono stati aggiunti. Alla fine, il tuo account potrebbe superare il limite di dimensioni di indicizzazione. In questi casi, puoi prendere in considerazione l'utilizzo di URL Mask . Questa funzione consente di nascondere documenti e pagine Web dalla ricerca per indicizzazione che non si desidera o non è necessario includere nell'indice, riducendo così la dimensione dell'indice. Un'altra opzione potrebbe consistere nel contattare il supporto tecnico per impostare il limite di dimensioni di indicizzazione su un valore maggiore nell'account.
Consultate Le maschere URL.
Se non sai cosa fare, contatta il supporto tecnico. Possono essere presenti molte altre variabili che influiscono sulla dimensione dell'indice e che, se modificate, possono anche influenzare la fatturazione dell'account.

Cosa controlla la codifica del set di caratteri della query di ricerca?

La sezione "Moduli Web" dell'account di ricerca contiene moduli di ricerca di esempio che consentono di aggiungere funzionalità di ricerca al sito Web. Se si guarda questo codice dei moduli di ricerca, è possibile trovare una riga simile alla seguente:
<input type=hidden name="sp_f" value="iso-8859-1">
Questa riga di codice indica al motore di ricerca che la query in entrata è codificata in iso-8859-1, una codifica comune per le lingue dell'Europa occidentale. Per modificare questa impostazione, vai al menu prodotto e fai clic su Settings > My Profile > Personal Information . Nella Personal Information pagina, nell’elenco a Character Encoding discesa, selezionate una nuova codifica.
Consultate Configurazione delle informazioni utente personali.
È inoltre possibile modificare manualmente il valore di codifica nelle pagine Web modificando la sp_f riga del modulo di ricerca. Tenere presente che il sp_f valore del modulo di ricerca deve corrispondere alla codifica set di caratteri della pagina in cui viene visualizzato.

Vengono cercate solo le pagine la cui codifica corrisponde alla codifica della query di ricerca?

Per impostazione predefinita, no. Fintanto che le pagine del sito Web identificano correttamente la codifica del set di caratteri, vengono effettuate le conversioni necessarie tra la codifica della query di ricerca e quella delle pagine, anche quando le pagine utilizzano più codifiche.

Quale codifica viene utilizzata per la pagina dei risultati della ricerca?

La codifica set di caratteri dell’account determina la codifica predefinita per il modello di risultati.
Consultate Configurazione delle informazioni utente personali.
Per ulteriori informazioni sulla specifica di un set di caratteri in un modello HTML.
Consultate Cercare i tag dei modelli.

È possibile utilizzare la ricerca del sito/merchandising su pagine codificate Unicode, UTF-8?

Sì. Tuttavia, i set di caratteri Unicode, come UTF-8, non forniscono informazioni sufficienti per determinare la lingua in cui sono scritte le pagine. Per eseguire correttamente la ricerca in queste pagine, è necessario specificare la lingua. Per determinare la lingua del documento, le informazioni vengono elaborate nel seguente ordine:
  • Intestazione HTTP Content-Language consegnata dal server al documento.
  • Elementi META (ad esempio, META HTTP-EQUIV="Content-Language" Content="ja_JP" ) nella <HEAD> sezione del documento.
  • Attributo LANG del <HTML> tag (ad esempio, <HTML LANG="ja_JP"> ).
Se il server non è configurato per inviare l’intestazione HTTP Content-Language e i documenti non contengono né l’elemento META della lingua né l’attributo della lingua per il <HTML> tag, potete utilizzare le iniezioni di metadati per specificare la lingua appropriata.
Vedere Aggiunta di definizioni di iniezione di campi.

Com'è possibile che non sia possibile effettuare ricerche nei file PDF cinesi, giapponesi o coreani sul sito Web?

Ricerca nel sito/merchandising ottiene l'UTF-8 da file Adobe PDF senza indicazione di lingua. Se avete selezionato PDF Documents ( Settings > Crawling > Content Types ), dovete utilizzare le iniezioni di metadati per specificare la lingua utilizzata nel file PDF.
Vedere Aggiunta di definizioni di iniezione di campi.

Com'è possibile che non sia possibile effettuare ricerche nei file SWF cinesi, giapponesi o coreani sul sito Web?

La ricerca nel sito/merchandising ottiene l'UTF-8 dai file di filmati Adobe Flash creati con Adobe Flash senza indicazione di lingua. Se avete selezionato il tipo di contenuto Adobe Flash Movies ( Settings > Crawling > Content Types ), dovete usare le iniezioni di metadati per specificare la lingua utilizzata nel file SWF.
Per Flash versione 4 o versioni precedenti di file SWF, il set di caratteri dei caratteri nel file non è specificato. Se avete selezionato il tipo di contenuto Adobe Flash Movies ( Settings > Crawling > Content Types ), dovete usare le iniezioni di metadati per specificare il set di caratteri utilizzato nel file SWF.
Vedere Aggiunta di definizioni di iniezione di campi.

Com'è possibile che non sia possibile effettuare ricerche nei file Microsoft Office cinesi, giapponesi o coreani sul sito Web?

Ricerca nel sito/merchandising ottiene UTF-8 da file di Microsoft Office (Microsoft Word, Microsoft Excel e Microsoft PowerPoint) senza alcuna indicazione di lingua. Se avete selezionato il tipo di contenuto Microsoft Office Files ( Settings > Crawling > Content Types ), dovete usare le iniezioni di metadati per specificare la lingua utilizzata nei file di Microsoft Office.
Vedere Aggiunta di definizioni di iniezione di campi.

Com'è possibile che non sia possibile effettuare ricerche nei file MP3 cinesi, giapponesi o coreani sul sito Web?

Se selezionate il tipo di contenuto Text in MP3 Music Files ( Settings > Crawling > Content Types ), dovete usare le iniezioni di metadati per specificare il set di caratteri utilizzato per codificare i file MP3.
Vedere Aggiunta di definizioni di iniezione di campi.

Devo fare qualcosa di speciale per far sì che i file .txt sul mio sito Web vengano indicizzati correttamente?

Se avete selezionato il tipo di contenuto Text Documents ( Settings > Crawling > Content Types ), dovete usare le iniezioni di metadati per specificare il set di caratteri utilizzato per codificare i file .txt.
Vedere Aggiunta di definizioni di iniezione di campi.

Com'è possibile che i font cinesi, giapponesi o coreani vengano visualizzati nei risultati di ricerca in Netscape 4.7 e versioni precedenti?

Se l'account utilizza il modello predefinito, uno dei modelli pronti per l'uso o un modello basato su uno di questi modelli, potrebbe contenere dei tag di font che specificano Arial o Helvetica come facce di font. Ad esempio, <font face="arial, helvetica" size="+1"> . Netscape 4.7 e versioni precedenti non visualizza i caratteri cinesi, giapponesi o coreani quando si utilizza il carattere Arial o Helvetica. Rimuovete l' face attributo o sostituite la faccia del font con una che sia più appropriata per cinese, giapponese o coreano.

Hai esaminato il tuo registro indice?

Il registro indice contiene informazioni dettagliate che il robot di ricerca/merchandising raccoglie nel momento in cui indicizza il sito Web. Il registro include un elenco di collegamenti sottoposti a ricerca per indicizzazione ed errori rilevati. Esaminare il registro indice è il punto migliore per iniziare a determinare il motivo per cui tutte le pagine del sito Web non sono indicizzate.

Si verificano errori di digitazione nell’URL?

Quando si digitano URL lunghi nei moduli HTML, è possibile che si verifichino uno o più errori tipografici. Tenete presente che gli URL non devono contenere spazi. Inoltre, alcuni server Web gestiscono gli URL in modo sensibile alle maiuscole/minuscole.
Nel menu del prodotto, fate clic su Settings > Crawling > URL Entrypoints . Nella Staged URL Entrypoints pagina, verifica quanto segue:
  • Negli URL non sono presenti errori tipografici.
  • I caratteri negli URL utilizzano tutti la combinazione di maiuscole e minuscole corretta.
  • Gli URL non contengono spazi.
Per verificare i punti di ingresso dell’URL, copiate e incollate un URL in un browser Web per verificare se il sito Web è visualizzato. Se non viene visualizzato, verificate nuovamente di non aver commesso errori nel percorso dell’URL.
Consultate I punti di ingresso URL.

La pagina Web entrypoint contiene collegamenti verso altre pagine del sito Web?

Il robot di ricerca del sito/merchandising passa per il sito Web proprio come fa il cliente; tramite collegamenti da una pagina all’altra. I collegamenti devono essere presenti nella pagina Web del punto di ingresso prima che il robot di ricerca possa trovare e indicizzare altre pagine sul sito.

I collegamenti ad altre pagine del sito Web sono incorporati in JavaScript?

Potete utilizzare sofisticate tecniche di navigazione sul sito Web, ad esempio azioni di rollover e menu, che utilizzano JavaScript per il collegamento ad altre pagine. Tuttavia, il robot di ricerca del sito/merchandising non può seguire i collegamenti incorporati in JavaScript.
Una soluzione che è possibile utilizzare per superare questo problema consiste nell'inserire collegamenti nascosti ad altre pagine nell'HTML che contiene il codice JavaScript. Anche se i clienti del tuo sito Web non vedono questi collegamenti, il robot di ricerca li trova ancora e li setaccia. Potete posizionare i tag nascosti nella parte inferiore della pagina immediatamente prima del </body> tag . Potrebbero essere come segue:
<a href="/mydir/mypag1.html"></a> 
<a href="/mydir/mypag2.html"></a>

Un'altra soluzione consiste nell'elencare gli URL delle pagine aggiuntive sul sito Web come punti di ingresso per la ricerca per indicizzazione e l'indicizzazione. Iniziate gli URL con https:// come illustrato di seguito:
https://www.mydomain.com/mydir/mypag1.html 
https://www.mydomain.com/mydir/mypag2.html

I tag HTML presenti nella pagina Web sono in una sequenza non valida?

La specifica HTML richiede che i <html> , <head> e <body> i tag seguano una sequenza specifica in un documento HTML. I tag in tutte le pagine Web devono avere la seguente sequenza:
<html> 
<head> 
...  
<i>head tags go here</i> ... 
</head> 
<body> 
...  
<i>body tags go here</i> ... 
</body> 
</html>

Se i tag HTML non sono nell'ordine corretto, il robot di ricerca/merchandising del sito non è in grado di analizzare e indicizzare correttamente la pagina Web. Di seguito è riportato un esempio di tag che non si trovano nella sequenza corretta:
<body> 
<head> 
...  
<i>head tags are here</i> ... 
</head> 
...  
<i>body tags are here</i> ... 
</body>

In tal caso, inserite i <html> , <head> e <body> i tag nella sequenza corretta sulla pagina Web.

Sono presenti tag di commento HTML non formattati correttamente nella pagina Web?

Verificate attentamente e correggete eventuali commenti HTML non validi presenti nelle pagine Web.
La specifica HTML richiede che un commento HTML inizi con i caratteri <!-- e termini con i caratteri --> . È facile ignorare i commenti formattati in modo errato che causano l'analisi errata dei tag nella pagina Web da parte del robot di ricerca del sito/merchandising. Un commento formato in modo errato può causare la perdita di altri tag importanti da parte del robot di ricerca/merchandising del sito. Ricorda i commenti immediatamente prima del <body> tag nella pagina Web.
Esempio di commento con formato corretto:
<!-- This HTML comment is OK. -->
Di seguito è riportato un esempio di commenti con formato non corretto:
<!- This HTML comment is improperly formed. -> 
<! This HTML comment is also improperly formed. >

La pagina Web contiene collegamenti alle pagine di un altro dominio?

Spesso un sito Web può essere costituito da pagine effettivamente presenti su un server Web con un indirizzo di dominio diverso. Ad esempio, se l’indirizzo del sito Web principale è il seguente:
https://www.mydomain.com/
Il sito Web può anche contenere pagine in un altro dominio, ad esempio:
https://www.otherdomain.com/
Per impostazione predefinita, il robot di ricerca del sito/merchandising non segue collegamenti su un dominio diverso da quello principale. Tuttavia, impostando altri punti di ingresso per l’account di ricerca, potete facilmente indicizzare più domini.
Nel menu del prodotto, fate clic su Settings > Crawling > URL Entrypoints . Aggiungete l'URL del "sito Web principale" del sito. Quindi, aggiungete altri punti di ingresso URL a qualsiasi altro dominio che contenga pagine del sito. Ad esempio, potete impostare il punto di ingresso dell’URL principale su:
https://www.mydomain.com/
e aggiungete il seguente punto di ingresso URL del sito:
https://www.otherdomain.com/

Utilizzi un servizio di dominio virtuale per il tuo URL?

È possibile che stiate utilizzando un servizio di dominio virtuale (talvolta denominato "servizio di reindirizzamento del dominio") per fornire un URL migliore per consentire ai clienti di accedere al sito Web. Ad esempio, supponiamo che l’indirizzo reale del sito Web sia il seguente:
https://www.myispdomain.com/~myname/mywebpages/
Tuttavia, potete utilizzare un servizio di dominio virtuale per consentire ai clienti di accedere al vostro sito ai seguenti indirizzi:
https://myname.adomain.com/
 oppure 
https://adomain.com/myname/
Per impostazione predefinita, il robot di ricerca del sito/merchandising non segue collegamenti su un dominio diverso da quello principale. Tuttavia, impostando altri punti di ingresso per l’account di ricerca, potete facilmente indicizzare più domini.
Nel menu del prodotto, fate clic su Settings > Crawling > URL Entrypoints . Aggiungete il "punto di ingresso dell’URL del sito Web principale" al nome del dominio virtuale del sito. Quindi, aggiungete altri punti di ingresso al dominio in cui vive effettivamente il sito Web.
Ad esempio, impostate il punto di ingresso dell’URL principale su quanto segue:
https://myname.adomain.com/
Aggiungete il seguente punto di ingresso URL del sito Web:
https://www.myispdomain.com/~myname/mywebpages/

La pagina Web utilizza un tag di aggiornamento meta?

Molti siti Web presentano una pagina anteriore che include un tag di aggiornamento meta tra <head>...</head> tag simili ai seguenti:
<meta http-equiv="Refresh" content="0;URL=https://www.adomain.com/apath/afile.html">
In alcune circostanze, il robot di ricerca del sito/merchandising non è in grado di seguire l’URL di aggiornamento meta per indicizzare il contenuto del sito Web. Questo problema è facile da risolvere impostando altri punti di ingresso.
Nel menu del prodotto, fate clic su Settings > Ricerca per indicizzazione > URL Entrypoints . Aggiungete un altro punto di ingresso all’URL del tag di aggiornamento meta.

La vostra pagina Web utilizza un tag meta robots?

Talvolta le pagine Web utilizzano tag meta-robot per controllare i robot Web che tentano periodicamente di sfogliare un sito Web. I tag meta-robot vengono visualizzati tra i <head>...</head> tag di una pagina Web e hanno un aspetto simile al seguente:
<meta name="robots" content="noindex, nofollow">
Poiché il robot di ricerca/merchandising del sito è esso stesso un robot web, segue le indicazioni del tag meta robot. Escludendo altri robot in questo modo si esclude anche il robot di ricerca del sito/merchandising.
Per ulteriori informazioni sui robot web e sul protocollo di esclusione dei robot, consulta:
Rimuovete o modificate il tag meta robot nelle pagine Web da indicizzare sul sito Web.

Il vostro sito Web utilizza un file di esclusione robot?

A volte un sito Web ha una pagina chiamata robots.txt che esclude tutti o alcuni robot dalla ricerca per indicizzazione. Per verificare se nel sito Web è presente un file robots.txt, cercarlo appena sotto il dominio di primo livello come illustrato di seguito:
https://www.yourdomain.com/robots.txt
Il contenuto del file robots.txt è simile al testo seguente:
User-agent: * 
Disallow: /

Poiché il robot di ricerca del sito/merchandising è esso stesso un robot web, segue le indicazioni nel file robots.txt-esclude il robot di ricerca del sito/merchandising. Per risolvere questo problema, modificare il file di esclusione dei robot (robots.txt) per consentire al robot di ricerca del sito/merchandising di eseguire ricerche per indicizzazione e indicizzare il sito Web come segue:
User-agent: Atomz/1.0 
Disallow: 
 
User-agent: * 
Disallow: /

Microsoft Office

Una pagina di domande frequenti che illustra il supporto per l'indicizzazione e la ricerca di file di Microsoft® Office in un sito Web.
Seguono alcune domande comuni sui file di Microsoft Office:

Cosa viene indicizzato in un file di Microsoft Office?

Il contenuto completo dei file di Microsoft Word, Microsoft Excel e Microsoft PowerPoint viene indicizzato.
Le parti seguenti di un file di Microsoft Word sono indicizzate:
  • Titolo
  • Parole chiave
  • Oggetto (Descrizione)
  • Contenuto basato su testo
  • Collegamenti ipertestuali ad altri documenti
Le parti seguenti di un file Microsoft Excel sono indicizzate:
  • Titolo
  • Parole chiave
  • Oggetto (Descrizione)
  • Testo nelle celle
  • Valori di formule numeriche nelle celle
Le parti seguenti di un file Microsoft PowerPoint sono indicizzate:
  • Titolo
  • Parole chiave
  • Oggetto (Descrizione)
  • Testo su ogni diapositiva

Cosa non viene indicizzato in un file di Microsoft Office?

Gli elementi grafici contenuti nei file di Microsoft Office o in qualsiasi testo contenuto non sono indicizzati. Le definizioni delle proprietà personalizzate non sono indicizzate come metadati. Anche il testo in campi speciali, come intestazioni e piè di pagina in un file PowerPoint, non viene indicizzato.

In che modo i file di Microsoft Office vengono indicizzati in modo diverso rispetto alle pagine HTML?

La differenza tra il modo in cui il robot di ricerca indicizza i file Microsoft Office e HTML è che ogni file HTML è una singola pagina e un singolo file di Microsoft Office può rappresentare centinaia di pagine. Per questo motivo, ogni pagina viene conteggiata all’interno di un file di Microsoft Office come pagina separata nell’account di ricerca.

Come si impedisce l'indicizzazione dei file di Microsoft Office sul sito Web?

Se non si desidera che il robot di ricerca esegua ricerche per indicizzazione e indicizzi i file di Microsoft Office, deselezionare il tipo di contenuto Microsoft Office Files ( Settings > Crawling > Content Types ).
È inoltre possibile utilizzare URL Masks per disabilitare l'indicizzazione dei file di Microsoft Office.
Immettete le seguenti maschere URL:
Se non si utilizzano espressioni regolari
  • exclude *.doc
  • exclude *.xls
  • exclude *.ppt
Se si utilizzano espressioni regolari
  • Escludi regexp ^.*\.doc$
  • Escludi regexp ^.*\.xls$
  • Escludi regexp ^.*\.ppt$

Quando viene creato un file MP3 con scorrimento e indicizzazione?

I file MP3 vengono sottoposti a ricerca per indicizzazione in due modi. Il metodo più comune è rappresentato da un tag href di ancoraggio in un file HTML:
<a href="MP3-file-URL"></a>
Un secondo modo consiste nell’inserire l’URL del file MP3 come punto di ingresso dell’URL.
Consultate I punti di ingresso URL.

Cosa devo fare per cercare e indicizzare i file MP3 sul mio sito?

Per attivare la ricerca per indicizzazione MP3 e l'indicizzazione per il proprio account, scegliere Settings > Crawling > Content Types dal menu del prodotto. Nella Staged Content Types pagina, selezionare Text in MP3 Music Files .
Consultate I Tipi Di Contenuto.

Come viene riconosciuto un file MP3?

Un file MP3 viene riconosciuto dal tipo MIME corrispondente a "audio/mpeg".

Cosa viene indicizzato in un file MP3?

Se necessario, i file MP3 memorizzano una piccola quantità di informazioni testuali. Tali informazioni possono includere il nome dell'album, il nome dell'artista, il titolo della canzone, il genere della canzone, l'anno di rilascio e un commento. Queste informazioni vengono memorizzate alla fine del file in quello che viene chiamato TAG. I file MP3 che contengono informazioni TAG sono indicizzati nel modo seguente:
  • Il titolo del brano viene trattato come il titolo di una pagina HTML.
  • Il commento viene trattato come una descrizione definita per una pagina HTML.
  • Il genere viene trattato come una parola chiave definita per una pagina HTML.
  • Il nome dell’artista, il nome dell’album e l’anno di rilascio vengono trattati come il corpo di un documento HTML.

Un file MP3 viene conteggiato come una pagina?

Sì, ogni file MP3 che viene sottoposto a ricerca per indicizzazione sul sito Web viene conteggiato come una pagina.

Come posso impedire l'indicizzazione di singoli file MP3?

Circondare i tag di ancoraggio che collegano ai file MP3 con <nofollow> tag e </nofollow> tag. Il robot di ricerca non segue i collegamenti tra tali tag.
Un altro metodo consiste nell’aggiungere gli URL dei file MP3 come maschere di esclusione.
Consultate Le maschere URL.
Consultate Lo script delle maschere URL.

Come posso impedire che i file MP3 vengano indicizzati?

Il modo più semplice per controllare l'indicizzazione MP3 per il vostro account è deselezionando Text in MP3 Music Files sulla Staged Content Types pagina.
Potete inoltre utilizzare la funzione Maschere URL per disattivare l'indicizzazione MP3 per estensione di file. A tale scopo, scegliere Settings > Crawling > URL Masks dal menu del prodotto. Inserite una delle seguenti maschere:
Se il tuo account...
Immettete la seguente maschera URL
Non utilizza espressioni regolari
exclude *.mp3
Utilizza espressioni regolari
Escludi regexp ^.*\.mp3$

Perché non è possibile effettuare ricerche nei file MP3 cinesi, giapponesi o coreani sul sito?

Per cercare file MP3 cinesi, giapponesi o coreani, nel menu del prodotto fate clic su Settings > Crawling > Content Types > Text in MP3 Music Files . Quindi, fate clic Settings > Metadata > Injections , quindi specificate il set di caratteri utilizzato per codificare i file MP3.

Cosa viene indicizzato in un file PDF?

Il contenuto completo dei file PDF è indicizzato. Le parti seguenti di un file PDF sono indicizzate:
  • Titolo
  • Parole chiave
  • Oggetto (Descrizione)
  • Contenuto basato su testo

Cosa non viene indicizzato in un file PDF?

Il sommario PDF, gli elementi grafici all’interno del file o qualsiasi testo contenuto in un elemento grafico non sono indicizzati.

Come vengono conteggiati i file PDF indicizzati?

Ogni file PDF viene conteggiato come singolo documento, inclusi i PDF che contengono più pagine.

I risultati della ricerca possono visualizzare un'icona PDF?

Sì. Usate il <search-if-link-extension> tag all’interno del modello per includere nei risultati della ricerca un’icona PDF o altri elementi grafici o testo:
<search-results> 
  ... 
  <search-if-link-extension value=".pdf"> 
    <img src="/search/i/pdficon.gif"> 
  </search-if-link-extension> 
  ... 
</search-results>

Le icone PDF consentono ai clienti di sapere che il risultato di una ricerca è collegato a un file PDF di grandi dimensioni. Le dimensioni dei file possono essere importanti per i clienti che accedono al sito Web tramite un modem o un dispositivo mobile.

È possibile collegare i risultati della ricerca a una particolare pagina in un file PDF?

Sì. Utilizzando il tag modello di collegamenti avanzati ( <search-smart-link>...</search-smart-link> ), i clienti possono fare clic per aprire la prima pagina PDF contenente il risultato della ricerca.
Per utilizzare i collegamenti avanzati, sostituite i <search-link>...</search-link> tag presenti nella sezione dei risultati di ricerca del modello con <search-smart-link>...</search-smart-link> i tag . Quando un cliente fa clic su un collegamento generato dai tag di collegamento avanzato, passa alla prima pagina PDF rilevante per la query di ricerca.
Per utilizzare questa funzione, il cliente deve utilizzare una versione recente di Adobe Acrobat o Adobe Acrobat Reader, che deve includere il plug-in di evidenziazione e il plug-in EWH (External Window Handler). Inoltre, il browser deve utilizzare il plug-in Adobe Acrobat per Netscape Navigator (è possibile utilizzare qualsiasi browser che accetta questo plug-in Netscape Navigator) o il controllo Acrobat ActiveX per Internet Explorer 4.0 e versioni successive.
Consultate Cercare i tag dei modelli.

Come si evita che i file PDF vengano indicizzati sul sito Web?

Se non si desidera che il robot di ricerca esegua ricerche per indicizzazione e indicizzi i file PDF, deselezionare il tipo di contenuto PDF Documents ( Settings > Crawling > Content Types ).
È inoltre possibile scegliere di disabilitare URL Masks l'indicizzazione PDF.
Per disattivare l'indicizzazione PDF, immettere una delle seguenti maschere URL:
  • exclude *.pdf (se non si utilizzano espressioni regolari)
  • exclude regexp ^.*\.pdf$ (se utilizzate espressioni regolari)

Com'è possibile che non sia possibile effettuare ricerche nei file PDF cinesi, giapponesi o coreani sul sito Web?

Ricerca nel sito/merchandising ottiene l'UTF-8 da file PDF senza indicazione di lingua. Se è stato selezionato il tipo di contenuto PDF Documents ( Settings > Crawling > Content Types ), è necessario utilizzare le iniezioni di metadati per specificare la lingua utilizzata nel file PDF.
Vedere Aggiunta di definizioni di iniezione di campi.

Troppe pagine

Una pagina di domande frequenti che spiega alcuni dei motivi per cui l'indicizzatore ha contato più pagine di quante ne possiate effettivamente, e qual è la soluzione in ogni caso.
Se siete certi che il sito Web è al di sotto del limite della pagina, ma l'indicizzatore sta dicendo che il limite è raggiunto, è necessario esaminare queste domande comuni e le risposte per possibili soluzioni.

Hai esaminato i vari registri indice?

Il registro indice contiene informazioni dettagliate raccolte dal robot di ricerca del sito/merchandising mentre indicizza il sito Web. Il registro include un elenco di tutti i collegamenti sottoposti a ricerca per indicizzazione ed è stato rilevato un errore. La verifica del registro di indice è la soluzione migliore per iniziare quando si tenta di determinare quali pagine vengono indicizzate.

I programmi CGI vengono indicizzati sul sito Web?

I programmi CGI utilizzano parametri URL che talvolta causano la ricerca per indicizzazione di più URL "falsi". Se la ricerca del sito/merchandising sta leggendo i vostri programmi CGI e i seguenti URL con parametri CGI, probabilmente ci sono diversi multipli di pagine sottoposte a ricerca per indicizzazione e indicizzazione che non sono utili per il vostro indice di ricerca. I parametri CGI tipici vengono visualizzati negli URL con ? o & caratteri.
Potete mascherare i programmi CGI dall’indicizzazione utilizzando la funzione Maschere URL. Potete mascherare un prefisso URL o usare espressioni regolari per mascherare gli script CGI.
Consultate Le maschere URL.
Consultate Lo script delle maschere URL.

Nel server è abilitata la navigazione nella directory?

Quando un server Web ha attivato la navigazione nelle directory e non esiste alcun file index.html presente in una determinata directory, una visita a tale directory può mostrare l’elenco dei file presenti in tale directory. In genere, nella parte superiore della pagina sono presenti dei collegamenti che consentono di ordinare l’elenco in modi diversi semplicemente facendo clic Name , Last modified , Size e così via. In genere, questi vengono visualizzati nel registro dell’indice di ricerca/merchandising del sito come URL con caratteri quali ?M=A alla fine. L’indicizzatore di ricerca/merchandising del sito segue questi collegamenti, e questo può causare l’indicizzazione di più URL "falsi".
In genere, un sito Web ben progettato ha file indice situati in ogni directory, o ha la navigazione directory disabilitata per quelle directory senza file indice. Fortunatamente, c'è un modo semplice per mascherare questi "falsi" URL se non si è in grado di cambiare le pagine o disabilitare gli elenchi di directory sul lato server.
Per eseguire questa operazione, fare clic su Settings > Crawling > URL Masks . Aggiungete una maschera per mascherare qualsiasi URL che contiene il carattere ? . Per eseguire questa operazione, immettete la seguente maschera di espressione regolare:
exclude regexp ^.*\?.*$
Dopo aver creato la maschera, accertatevi di reindicizzare il sito Web.

Ci sono forum o newsgroup sul vostro sito Web?

Se i forum o i newsgroup vengono sottoposti a ricerca per indicizzazione sul sito Web, potrebbero essere presenti URL per opzioni di visualizzazione o ordinamento diverse. Questo significa che la stessa pagina viene indicizzata più volte.
In genere, i forum o i newsgroup sono dotati di motori di ricerca personalizzati. In tal caso, potete usare URL Masks per mascherare i forum da ricerche e merchandising sul sito.
Nel menu del prodotto, fate clic su Settings > Crawling > URL Masks . Nella Staged URL Masks pagina, mascherate i forum immettendo i relativi URL come maschere URL escluse.
Dopo aver creato le maschere, accertatevi di reindicizzare il sito Web.

Nel sito Web sono presenti file PDF o Microsoft Office?

Se sul sito Web sono presenti file PDF o Microsoft Office file, è possibile che la dimensione indice di pochi file conteggi molte pagine. Il motivo per cui ci sono più pagine da indicizzare rispetto ai documenti è che ogni pagina di un file PDF o Microsoft Office viene conteggiata come una pagina separata.
Nel menu del prodotto, fate clic su Index > Full Index > Live Index . Nella Full Index pagina, selezionare Count All Pages , quindi fare clic Full Index Now per visualizzare il conteggio totale delle pagine. Se non si desidera indicizzare file PDF o file di Microsoft Office, è possibile disattivare questo tipo di contenuto in Settings > Crawling > Content Types .
Consultate I Tipi Di Contenuto.

Hai più punti di ingresso URL?

Il robot di ricerca del sito/merchandising inizia la ricerca per indicizzazione in corrispondenza di specifici punti di ingresso URL e segue tutti i collegamenti trovati a tutto il contenuto in quel particolare dominio. Se avete specificato molti punti di ingresso URL, è possibile che venga applicato il crawled a un numero significativo di pagine.
Utilizzate il nofollow tag Robots Exclusion Protocol nelle intestazioni dei documenti di entrata sui domini aggiuntivi, come segue:
<html> 
<head> 
<meta name="robots" content="nofollow"> 
</head>

Il codice riportato sopra indica al robot di ricerca del sito/merchandising di indicizzare il contenuto della pagina, ma non di seguire i collegamenti verso altre pagine.
Per ulteriori informazioni sui robot web e sul protocollo di esclusione dei robot, consulta:
Se non disponete dell'accesso all'origine delle pagine su domini aggiuntivi, potete rimuovere i diversi punti di ingresso URL. In questo modo potete limitare l'attività di indicizzazione solo ai domini di cui desiderate che i clienti siano in grado di effettuare ricerche.
Consultate I punti di ingresso URL.

Hai superato i byte interni o i limiti di tempo di ricerca/merchandising del sito?

Verificate che il vostro account abbia raggiunto il limite nella schermata "Stato indice completo". Se lo stato indica che l'indice è superiore al consentito o che richiede più tempo del consentito, il sito Web non viene indicizzato completamente. Potete correggere questo errore in modo da ottenere la copertura e il conteggio corretti delle pagine del sito Web.
Per proteggere i server di ricerca/merchandising del sito, esistono limiti interni di byte e tempo. Solo quando i file sottoposti a ricerca per indicizzazione sono molto grandi, o quando il server che la ricerca/merchandising del sito sta tentando di raggiungere è lento, questi limiti sono raggiunti.
Se raggiungete un limite di tempo, accertatevi che il server sia online e tentate di nuovo l’indice in un secondo momento. Se si raggiunge un limite di byte, controllare i file sottoposti a ricerca per indicizzazione visualizzando il registro di indice. Sono insolitamente grandi? Se ricevete uno di questi messaggi, contattate l’assistenza tecnica.