Show Menu
THEMEN×

Häufig gestellte Fragen

Wann wird eine SWF-Datei durchsucht und indiziert?

Eine SWF-Datei wird durchsucht und indiziert, wenn sie in einem Einbettungs- oder Objekt-Tag auf einer HTML-Seite enthalten ist, wie im folgenden Beispiel:
<embed src="Flash-file-URL">  
 
<object>  
<param name=movie value="Flash-file-URL">  
</object> 

Eine SWF-Datei wird auch erkannt, wenn Sie die Datei-URL als Einstiegspunkt angeben.

Was muss ich tun, um eine SWF-Datei zu indizieren?

Um SWF-Dateien zu durchsuchen und zu indizieren, wählen Sie den Inhaltstyp Adobe Flash Movies ( Settings > Crawling > Content Types ).
Solange auf Ihre Flash-Datei von einem <embed> -Tag oder einem <object> -Tag in einem HTML-Dokument verwiesen wird, wird der Text indiziert und alle in der Datei aufgelisteten URLs werden durchsucht.
Wenn Ihre Datei weder von einem <embed> Tag noch von einem <object> -Tag aus referenziert wird, können Sie die SWF-Datei in einem <a href=...> -Tag in einem HTML-Dokument oder als URL-Einstiegspunkt auflisten.

Wie werden SWF-Dateien erkannt?

SWF-Dateien werden durch den folgenden MIME-Typ identifiziert:
application/x-shockwave-flash
SWF-Dateien werden auch mit application/octet-stream "- oder text/plain MIME-Typen erkannt, vorausgesetzt, die Dateierweiterung lautet .swf.
Ein falsch konfigurierter Server verwendet möglicherweise einen anderen MIME-Typ für SWF-Dateien. Überprüfen Sie unbedingt die Serverkonfiguration, wenn beim Crawling und Indizieren von SWF-Dateien Probleme auftreten.

Wie werden SWF-Dateien indiziert?

In einer SWF-Datei enthaltener Text wird indiziert, als wäre er <body> Text auf der umschließenden HTML-Seite. Wenn ein Suchergebnis Text findet, der in einer eingebetteten SWF-Datei enthalten ist, wird das Ergebnis tatsächlich mit der einschließenden HTML-Seite und nicht mit der SWF-Datei verknüpft. Auf diese Weise wird die SWF-Datei im richtigen Kontext angezeigt.
Wenn eine SWF-Datei eine URL als Aktion "Film laden"enthält, wird der Text in der referenzierten SWF-Datei als Teil der umschließenden HTML-Seite indiziert.
Wenn eine SWF-Datei eine URL als Aktion "URL abrufen"enthält, wird die URL zu einem späteren Zeitpunkt durchsucht und indiziert, genau wie eine HTML- <a href=...> Referenz zu einem späteren Zeitpunkt durchsucht und indiziert wird.
Wenn eine SWF-Datei als URL-Einstiegspunkt aufgeführt wird, wird der Text der SWF-Datei als eine einzige Seite indiziert. Ein Suchergebnis, das Text von einer Einstiegs-SWF-Verknüpfung direkt zum Film findet, nicht zu einer umschließenden HTML-Seite.

Zählt eine SWF-Datei als Seite?

Nein. Eine SWF-Datei wird als Teil ihrer umschließenden HTML-Seite betrachtet. Alle in SWF-Dateien enthaltenen "Film laden"-URLs gelten auch als Teil der umschließenden HTML-Seite. Daher zählen SWF-Dateien, auf die von einer HTML-Seite verwiesen wird, nicht als "Seite"für den Gesamtwert der Kontoseite.
Wenn eine SWF-Datei als URL-Einstiegspunkt aufgeführt ist, werden diese SWF-Datei und alle in dieser SWF-Datei aufgelisteten "Film laden"-URLs als eine "Seite"für die Gesamtsumme der Kontoseite gezählt.

Wie kann ich die Indizierung einzelner SWF-Dateien verhindern?

Um die Indexierung einer SWF-Datei zu verhindern, können Sie dem umschließenden HTML-Dokument entweder ein Robots-Meta-Tag ( <meta name="ROBOTS" content="NOINDEX"> ) oder ein <noindex> -Tag hinzufügen. Das heißt, das Dokument, das das <embed> oder- <object> Tag enthält.
Sie können auch das Meta-Tag "robots"( <meta name="ROBOTS" content="NOFOLLOW"> ) verwenden, um folgende URLs zu verhindern, die in der SWF-Datei enthalten sind. Wenn das einschließende HTML-Dokument deaktiviert ist, werden die URLs, die in der SWF-Datei als "URL abrufen"aufgeführt sind, nicht befolgt.

Wie kann ich verhindern, dass SWF-Dateien auf meiner Website indiziert werden?

Um die SWF-Indexierung zu deaktivieren, deaktivieren Sie den Inhaltstyp Adobe Flash Movies ( Settings > Crawling > Content Types ).
Sie können auch die Indexierung von SWF-Dateien deaktivieren URL Masks lassen.
Um die SWF-Indexierung zu deaktivieren, geben Sie eine der folgenden URL-Masken ein:
  • exclude *.swf (wenn Sie keine regulären Ausdrücke verwenden)
  • exclude regexp ^.*\.swf$ (wenn Sie reguläre Ausdrücke verwenden)

Wie kommt es, dass ich die chinesischen, japanischen oder koreanischen SWF-Dateien auf meiner Website nicht durchsuchen kann?

Site-Suche/Merchandising ruft UTF-8 aus SWF-Dateien ab, die mit Adobe Flash erstellt wurden. Der UTF-8 enthält keine Angabe der Sprache. Wenn Sie den Inhaltstyp ausgewählt haben Adobe Flash Movies ( Settings > Crawling > Content Types ), müssen Sie mithilfe der Metadaten-Injektionen die Sprache angeben, die von der SWF-Datei verwendet wird.
Ältere SWF-Dateien geben auch keinen Zeichensatz an. Wenn Sie den SWF-Inhaltstyp ausgewählt haben Adobe Flash Movies ( Settings > Crawling > Content Types ), müssen Sie den in der SWF-Datei verwendeten Zeichensatz mithilfe von Metadaten-Injektionen angeben.

Allgemeine Suche

Eine Seite mit häufig gestellten Fragen, auf der erläutert wird, wie Site-Suche/Merchandising Kunden, die Ihre Website besuchen, dabei unterstützt, das zu finden, wonach sie suchen.
Bei der allgemeinen Suche stellen sich folgende Fragen:
Im Folgenden werden häufig gestellte Fragen zu Suchfunktionen aufgeführt:

Muss ich irgendeine Software installieren, um Site-Suche/Merchandising zu verwenden?

Nein. Dies ist der Hauptvorteil von Site-Suche/Merchandising. Die Engine ist eine professionelle Anwendung, die komplett auf unseren Hochleistungsservern gehostet und gewartet wird. Dadurch wird die Software einfacher zu verwenden als andere Suchlösungen. Sie müssen nur eine kleine Menge HTML-Code zu Ihren Seiten hinzufügen, damit Kunden Ihrer Website Suchvorgänge eingeben können. Die Site-Suche/Merchandising kümmert sich um den Rest.

Was passiert, wenn meine Site das Seitenlimit überschreitet?

Wir führen weiterhin Suchvorgänge durch, damit Ihre Besucher Ihre Website ohne Unterbrechung durchsuchen können. Überprüfen Sie Ihren vollständigen Indexstatus oder das Live-Protokoll, um festzustellen, ob Ihre Website die Seitenbegrenzung überschreitet.

Wie ändere ich die E-Mail-Adresse, an die die wöchentlichen Berichte gesendet werden?

Wöchentliche Berichte werden an den Eigentümer jedes aktiven Kontos gesendet. Sie können die E-Mail-Adresse ändern, indem Sie auf Settings > My Profile > Personal Information . Wenn Sie mehr als ein aktives Suchkonto haben, werden alle Newsletter an die neue Adresse gesendet.

Wie sicher sind meine Kundeninformationen bei der Site-Suche/beim Merchandising?

Site-Suche/Merchandising ist sicher, schnell, stabil und einfach zu verwenden. Sie sind nicht gezwungen, Cookies zu verwenden (wenn Sie möchten, können Sie dies aber tun), und vertrauliche Informationen wie Passwörter werden niemals auf einen URL-Link gesetzt, der später von Ihrem Browser abgerufen werden kann.

Was ist mit der Privatsphäre meiner Kundeninformationen?

Adobe achtet die Privatsphäre seiner Kunden und Besucher. Siehe Adobe Privacy Center .

Kann ich meine eigenen Banneranzeigen auf den Suchergebnisseiten anzeigen?

Ja. Sie steuern das Erscheinungsbild und den Inhalt der Suchergebnisse. In der Suchergebnisvorlage für Ihre Website können Sie Links zu Ihrem eigenen Banneraustauschnetzwerk wie LinkExchange oder SmartClicks erstellen. Alle Treffer Ihrer Besucher werden Ihrem Banneraustauschkonto gutgeschrieben.

Kann ich die Suchergebnisse für meine Site anpassen?

Ja. Dies ist eine exklusive Funktion der Site-Suche/des Merchandisings. Mit unserer fortschrittlichen Vorlagentechnologie und einem wenig Wissen über HTML können Sie genau steuern, wie die Suchergebnisse aussehen.
Der Übergang zwischen Ihren eigenen Servern und Site-Such-/Merchandising-Servern ist für Ihre Kunden völlig nahtlos und unsichtbar. Wenn Sie HTML nicht kennen oder keine Zeit haben, eine benutzerdefinierte Vorlage zu erstellen, können Sie aus einer Reihe attraktiver, gebrauchsfertiger Vorlagen auswählen, die von dem internen Team professioneller Webentwickler von Adobe erstellt werden.

Kann ich sehen, nach welchen Kunden auf meiner Site gesucht wird?

Ja. Wir führen Suchstatistiken über die Suchvorgänge der Besucher Ihrer Website in den letzten zwei Monaten. Sie können diese Statistiken jederzeit unter Berichte im Produktmenü überprüfen. Suchberichte geben Ihnen wichtige Informationen darüber, was Besucher auf Ihrer Website genau suchen. Mit diesen Informationen können Sie das Design verbessern oder die Suchmaschine/Merchandising der Site so einstellen, dass sie Ihren Besuchern besser hilft.

Wie kann ich steuern, welche Inhaltstypen (PDF, Text, Flash, MP3 und Microsoft Office) indiziert und gesucht werden?

Sie können Konten ganz einfach so konfigurieren, dass die Indizierung und Suche von Text in PDF-Dokumenten, Normaltext-Dokumenten, Flash-Filmen, MP3-Dateien oder Microsoft Office-Dokumenten aktiviert oder deaktiviert wird.
Diese Einstellungen werden auf der Staged Content Types Seite gesteuert.

Werden dynamisch generierte Webseiten mit ASP-, JSP-, PHP-, CFM- oder Perl-basierten Inhalten unterstützt?

Statische oder dynamisch generierte HTML-Webseiten werden indiziert, einschließlich Seiten, die aus Datenbanken erstellt wurden, oder jeder andere Back-End-Prozess. Da der HTML-Code, den ein Browser sieht, indiziert ist, können Sie Site-Suche/Merchandising auf Websites verwenden, solange diese Back-End-Architekturen HTML-Seiten ergeben.
Der Suchroboter durchsucht Ihre Website, indem er mit der ersten Seite an der Adresse der Website beginnt, die in angegeben ist Account Settings, und folgt Links von Seite zu Seite.
Wenn der Suchroboter alle Seiten Ihrer Website durchsucht und indiziert, können Sie die Suchmaschine verwenden, um Ihre Site zu suchen. Mit anderen Worten, wenn dynamisch erstellte Dokumente mit Links von anderen Seiten in Ihre Website eingebunden werden, kann der Suchroboter trotzdem durchsuchen und den dynamischen Inhalt indizieren.
Nachdem der Inhalt Ihrer Website durchsucht und indexiert wurde, können Kunden Ihrer Website nach Informationen im indizierten Inhalt suchen.

Wie kann ich Synonyme verwenden, um die Suchergebnisse für meine Site zu verbessern?

Sie können Synonyme verwenden, wenn Sie möchten, dass Besucher Seiten finden, die mit ihrer Suchabfrage zusammenhängen.
Angenommen, Sie haben eine Seite mit einer Preisliste von Produkten, die auf Ihrer Site zum Verkauf angeboten werden. Nach der Prüfung der Suchberichte, die durch Site-Suche/Merchandising bereitgestellt werden, stellen Sie jedoch fest, dass Kunden bei ihren Suchvorgängen nach dem Wort "Kosten", "Kosten", "Gebühr"oder "Gebühr"suchen. Diese Wörter zeigen Ihre Preislistenseite nicht in den Suchergebnissen an. Mit der Add Synonyms DictionariesFunktion in können Sie angeben, dass diese Wörter alle Synonyme sind, und Ihr Kunde kann Ihre Preisliste finden, unabhängig davon, welchen Suchbegriff er verwendet.

Habe ich die Kontrolle über die Reihenfolge der Suchergebnisse?

Ja. Mithilfe der Benutzeroberfläche für erweiterte Relevanz können Sie steuern, welche Seiten für eine bestimmte Suchabfrage zurückgegeben werden. Diese Funktion ist nützlich, wenn Sie sicherstellen möchten, dass Kunden eine bestimmte Seite sehen, wenn sie nach bestimmten Wörtern suchen.

Kann ich die Sprache der Suchergebnisseite ändern?

Ja. Die Vorlage für die Site-Suche/das Merchandising ist flexibel, wenn es darum geht, eine Ergebnisseite zu erstellen, die die Sprache Ihrer Wahl verwendet und mit dem Erscheinungsbild Ihrer Website übereinstimmt.
Die Vorlage besteht aus einer Kombination aus Text, Standard-HTML-Tags und speziellen Tags, die zur Anzeige der Suchergebnisse definiert werden. Wenn ein Kunde eine Suche durchführt, liest der Suchroboter die Vorlage, gibt den Text mit standardmäßigen HTML-Tags aus und fügt die Ergebnisverknüpfungen auf der Grundlage der speziellen Vorlagen-Tags ein.
Wenn Sie die Sprache der Ergebnisse ändern möchten, können Sie den englischen Text bearbeiten, der in der Vorlage angezeigt wird.

Kann ich mehr als eine Site auf meiner Adobe-Kundenanmeldung verwenden?

Ja. Mit einer einzigen Adobe-Kundenanmeldung können Sie eine andere Suchmaschine für viele verschiedene Websites verwalten. Wählen Sie Konten unter "Konten"aus und verwalten Sie sie.

Kann ich mehr als eine Domäne suchen?

Ja. Sie können den Zugriff auf mehrere Domänen mithilfe von URL Entrypointskonfigurieren. Geben Sie URL-Einstiegspunkte für zusätzliche Domänen an, deren Inhaber Sie sind. Denken Sie daran, dass Sie über die Berechtigung zum Indexieren von Domänen verfügen müssen, deren Inhaber Sie nicht sind.

Kann ich meine Site in separate Abschnitte unterteilen, damit Kunden diese Bereiche einzeln oder die gesamte Site durchsuchen können?

Ja. Eine Funktion "Sammlungen"ist enthalten, mit der Kunden bestimmte Bereiche Ihrer Website suchen können, um schnell das zu finden, wonach sie suchen.
Kunden können beispielsweise eine Sammlung von URLs im Zusammenhang mit Produktverkaufsinformationen oder eine Sammlung von URLs im Zusammenhang mit Supportdiensten suchen. Sie können Sammlungen so einrichten, dass Ihren Kunden eine Dropdownliste mit Sammlungen oder eine Gruppe von Kontrollkästchen angezeigt wird.

Wie kann ich Teile meiner Website von der Suche ausschließen?

Ja. Geben Sie URL-Masken an, um festzulegen, welche Webseiten in die Indexierung einbezogen oder ausgeschlossen werden sollen. URL-Masken bestimmen, ob Webseiten in den Suchergebnissen angezeigt werden.
Siehe URL-Masken .
Siehe Skript "URL-Masken" .
Um zu verhindern, dass Teile einzelner Webseiten durchsucht werden, können Sie Teile einer Seite von der Indexierung ausschließen. Richten Sie den Text mit <noindex> und </noindex> -Tags ein. Diese Methode ist nützlich, wenn Sie Navigationstext von Suchvorgängen ausschließen möchten.

Welche Zeichensätze werden unterstützt?

Webseiten geben den Zeichensatz normalerweise mit einem Meta-Tag an, das dem Folgenden ähnelt:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
Die Site-Suchmaschine/Merchandising indiziert Webseiten ordnungsgemäß mit allen gängigen Zeichensätzen, die heute im Internet verwendet werden. Einige der unterstützten Zeichensätze umfassen Folgendes:
Arabisch (ISO-8859-6)
Chinesisch (traditionell) Big5)
Japanisch (Shift_JIS)
Arabisch (Windows-1256)
Chinesisch (traditionell) EUC-TW)
Russisch (KOI8-R)
Ostsee (ISO-8859-4)
Kyrillisch (ISO-8859-5)
Südeuropäisch (ISO-8859-3)
Baltic (Windows-1257)
Kyrillisch (Windows-1251)
Türkisch (ISO-8859-9)
Mitteleuropäisch (ISO-8859-2)
Griechisch (ISO-8859-7)
Türkisch (Windows-1254)
Mitteleuropäisch (Windows-1250)
Griechisch (Windows-1253)
Unicode (UTF-8)
Chinesisch (ISO-2022-CN)
Hebräisch (ISO-8859-8)
US-ASCII (us-ascii)
Chinesisch (ISO-2022-CN-EXT)
Hebräisch (Windows-1255)
Westeuropäisch (ISO-8859-1)
Chinesisch (vereinfacht) EUC-CN)
Japanisch (EUC-JP)
Westeuropäisch (ISO-8859-15)
Chinesisch (vereinfacht) GB2312)
Japanisch (ISO-2022-JP)
Westeuropäisch (Windows-1252)
Chinesisch (vereinfacht) GBK)
Japanisch (ISO-2022-JP-1)
Westeuropäisch (x-mac-roman)
Chinesisch (vereinfacht) HZ-GB-2312)
Japanisch (ISO-2022-JP-2)
Wenden Sie sich an den technischen Support, wenn Sie Fragen zu den oben nicht aufgelisteten Zeichensätzen haben.

Was ist, wenn ich meine Website ändere oder aktualisiere?

Nachdem Sie den Inhalt Ihrer Website geändert haben, können Sie entweder einen vollständigen oder einen inkrementellen Index durchführen. Die Site-Suche/das Merchandising lädt alle geänderten Website-Inhalte herunter und indiziert diese. Nach Abschluss der Indexierung können Ihre Kunden den neuen Inhalt durchsuchen. Sie können auch eine automatische Indexierung Ihrer Site zu einem bestimmten Zeitpunkt und an einem bestimmten Tag planen.

Kann meine Site automatisch indiziert werden?

Ja. Sie können jeden Tag einen automatischen Index Ihrer Site planen.
Neben der täglichen automatischen Indizierung können Sie festlegen, dass häufig geänderte Teile ihrer Site inkrementell indiziert werden. An Tagen, für die ein automatischer Index geplant ist, können Sie steuern, wann der Index stattfindet. Außerdem können Sie jederzeit manuell einen Site-Index starten, wann immer Sie möchten.

Ich verwende Kennwörter auf meiner Website. Kann ich weiterhin Site-Suche/Merchandising verwenden?

Wenn Sie die HTTP Basic-Authentifizierung zum Schutz bestimmter Bereiche Ihrer Website mit einem Kennwort verwenden, können Sie Bereiche und Kennwörter angeben, mit denen die Site-Suche/Merchandising Ihre Site indizieren kann.

Unterstützen Sie das Crawling und Indizieren von HTTPS oder sicheren Serverinhalten?

Ja. Sie können Inhalte auf sicheren Servern (https) suchen und indizieren.

Erfüllt Site-Suche/Merchandising die Datei "robots.txt"auf meiner Website?

Ja. Das Robots-Ausschlussprotokoll ist konform. Der Suchroboter prüft die Datei "robots.txt", wenn sie auf Ihrer Website vorhanden ist. Wenn Ihre Datei "robots.txt"alle Roboter vom Crawling Ihrer Site ausschließt, wird auch der Site-Such-/Merchandising-Roboter ausgeschlossen. Damit nur der Site-Such-/Merchandising-Roboter Ihre Site durchsuchen kann, stellen Sie den Inhalt Ihrer Datei "robots.txt"auf Folgendes ein:
User-agent: Atomz/1.0 
Disallow:

User-agent: * 
Disallow: /

Weitere Informationen zu Webrobotern und dem Roboter-Ausschlussprotokoll finden Sie unter:

Bestimmte Teile meiner Website müssen regelmäßig aktualisiert werden, damit meine Kunden die genauesten Suchergebnisse erhalten. Hilft die inkrementelle Indexierung bei diesem Problem?

Ja. Dieses Szenario wurde mit der inkrementellen Indexierungsfunktion erstellt, um die Site-Suche/das Merchandising zu erleichtern. Der Hauptvorteil der inkrementellen Indexierung besteht darin, dass Unternehmen häufig dynamisch veränderte Teile ihrer Website indizieren können. Diese Funktion stellt sicher, dass Sie Suchergebnisse mit einer Genauigkeit von "bis zur Minute"anzeigen.

Werden dynamisch generierte Webseiten von einer Back-End-Datenbank wie Produktkatalogen oder Lagerbestandsverwaltungssystemen unterstützt?

Statische oder dynamisch erstellte HTML-Webseiten, einschließlich Seiten, die aus Datenbanken erstellt wurden, oder andere Back-End-Prozesse werden indiziert. Da der von einem Browser angezeigte HTML-Code indiziert ist, können Sie die Site-Suche/das Merchandising auf Websites verwenden, solange die Back-End-Datenbankinformationen HTML-Seiten ergeben.
Der Suchroboter durchsucht Ihre Website, indem er mit der ersten Seite an der Adresse der Website beginnt, die in angegeben ist Account Settings, und folgt Links von Seite zu Seite.
Wenn der Suchroboter alle Seiten Ihrer Website durchsucht und indiziert, können Sie die Suchmaschine verwenden, um Ihre Site zu suchen. Mit anderen Worten, wenn dynamisch erstellte Dokumente mit Links von anderen Seiten in Ihre Website eingebunden werden, kann der Suchroboter trotzdem den Inhalt der dynamischen Datenbank durchsuchen und indizieren.
Nachdem der Inhalt Ihrer Website durchsucht und indexiert wurde, können Kunden Ihrer Website nach Informationen im indizierten Inhalt suchen.
Sie können auf einfache Weise die Suche nach vollständigem Inhalt oder eine engere themenbasierte Suche aktivieren, die auf Informationen im Titel, die Metadaten-Beschreibung, die Meta-Keywords-Dokument-Tags oder alle drei beschränkt ist. Mithilfe von Metadatendefinitionen können Sie auch benutzerdefinierte Anzeigefelder, z. B. ein Produktbild, in den Suchergebnissen erstellen.

Kann ich Skripten oder Programme verwenden, um einen inkrementellen Index meiner Site auszulösen?

Ja. Sie können Skripten oder Programme verwenden, um einen inkrementellen Index Ihrer Website zu initiieren und um die Server zu pten, um die Site zu indizieren, sobald Inhalte geändert oder aktualisiert werden.

Funktionsimplementierungen

Eine Seite mit häufig gestellten Fragen, auf der verschiedene Funktionsimplementierungen in behandelt Search&Promotewerden.
Im Folgenden werden häufig gestellte Fragen zu Funktionsimplementierungen auf Search&Promote einer Website behandelt:

Warum laufen meine Geschäftsregeln nicht?

Konfigurieren Sie Geschäftsregeln, wenn Banner angezeigt werden, oder entscheiden Sie, welche Ergebnisse in welcher Reihenfolge angezeigt werden. Sie können auch die Position eines Elements in Ihrer Facette und die Vorlage für eine bestimmte Suche konfigurieren. Ordnen Sie Geschäftsregeln neu an, um die Reihenfolge zu ändern, in der sie auf Präsentationsvorlagen ausgeführt werden. Geschäftsregeln werden in der Reihenfolge ausgeführt, in der sie festgelegt wurden. d. h. je höher die Ordnungsnummer einer Regel ist, desto später wird sie im Prozess ausgeführt, wodurch frühere Regeln übertroffen werden. Sie können Regeln neu anordnen, indem Sie auf der Seite "Geschäftsregeln"in die Spalte "Reihenfolge"der Tabelle eine neue Zahl eingeben.

Warum habe ich Probleme bei der Planung der Indexierung, Fehler beim Starten der Indexierung und Probleme beim Starten der Indexierung?

Wenn Sie einen Index generieren, unabhängig davon, ob er vollständig oder inkrementell ist, werden die Informationen zum Index-Crawl-Status in Echtzeit angezeigt. Beispielsweise können Sie die Startzeit, die verstrichene Zeit und alle Fehler anzeigen, die während des Indexierungsvorgangs aufgetreten sind. Informationen zum Status des letzten Index werden ebenfalls angezeigt. Verwenden Sie diese Informationen, um etwaige Indexierungsfehler zu beheben.

Meine Indexgrößenbeschränkung überschreitet meine zulässige Grenze. Warum geschieht das und wie repariere ich es?

Eine Website kann mit der Zeit wachsen und Search&Promote "entdeckt" mehr Dokumente und Webseiten, die hinzugefügt wurden. Eventuell kann Ihr Konto Ihre Indexgrößenbeschränkung überschreiten. In solchen Fällen können Sie die Verwendung in Betracht ziehen URL Mask . Diese Funktion blendet Dokumente und Webseiten bei Index-Crawling aus, die Sie nicht indizieren möchten oder nicht benötigen, und reduziert so Ihre Indexgröße. Eine andere Möglichkeit könnte darin bestehen, sich an den technischen Support zu wenden, um die Indexierungsgrößenbegrenzung in Ihrem Konto zu erhöhen.
Siehe URL-Masken .
Wenn Sie sich nicht sicher sind, was Sie tun sollen, wenden Sie sich an den technischen Support. Es kann noch viele andere Variablen geben, die sich auf Ihre Indexgröße auswirken und bei einer Anpassung auch die Rechnungsstellung Ihres Kontos beeinflussen können.

Was steuert die Zeichensatzkodierung der Suchabfrage?

Der Abschnitt "Web-Formulare"Ihres Suchkontos enthält Mustersuchformulare, mit denen Sie Ihrer Website Suchfunktionen hinzufügen. Wenn Sie diesen Suchformularcode betrachten, können Sie eine Zeile wie die folgende finden:
<input type=hidden name="sp_f" value="iso-8859-1">
Diese Codezeile teilt der Suchmaschine mit, dass die eingehende Abfrage in iso-8859-1 kodiert ist, einer gängigen Kodierung für westeuropäische Sprachen. Sie können diese Einstellung ändern, indem Sie im Produktmenü auf Settings > My Profile > Personal Information . Wählen Sie auf der Personal Information Seite in der Character Encoding Dropdownliste eine neue Kodierung aus.
Sie können den Kodierungswert auf Ihren Webseiten auch manuell ändern, indem Sie die sp_f Zeile des Suchformulars bearbeiten. Denken Sie daran, dass der sp_f Wert des Suchformulars mit der Zeichensatzkodierung der Seite, auf der es angezeigt wird, übereinstimmen muss.

Werden nur Seiten durchsucht, deren Kodierung mit der Kodierung der Suchanfrage übereinstimmt?

Standardmäßig ist "Nein" eingestellt. Solange die Seiten Ihrer Website die Zeichensatzkodierung richtig identifizieren, werden die erforderlichen Konvertierungen zwischen der Kodierung der Suchanfrage und der der Seiten vorgenommen, auch wenn Seiten mehrere Kodierungen verwenden.

Welche Kodierung wird für die Suchergebnisseite verwendet?

Die Zeichensatzkodierung Ihres Kontos bestimmt die Standardkodierung für Ihre Ergebnisvorlage.
Weitere Informationen zum Festlegen eines Zeichensatzes in einer HTML-Vorlage erhalten Sie.

Kann ich Site-Suche/Merchandising auf Unicode-, UTF-8-, kodierten Seiten verwenden?

Ja. Unicode-Zeichensätze wie UTF-8 bieten jedoch nicht genügend Informationen, um die Sprache zu bestimmen, in der die Seiten geschrieben werden. Um diese Seiten korrekt zu durchsuchen, müssen Sie die Sprache angeben. Zur Bestimmung der Dokumentsprache werden die Informationen in der folgenden Reihenfolge verarbeitet:
  • Content-Language HTTP-Header, der von Ihrem Server für das Dokument bereitgestellt wird.
  • META-Elemente (z. B. META HTTP-EQUIV="Content-Language" Content="ja_JP" ) im <HEAD> Abschnitt des Dokuments.
  • LANG-Attribut des <HTML> Tags (z. B. <HTML LANG="ja_JP"> ).
Wenn Ihr Server nicht für die Bereitstellung des Content-Language-HTTP-Headers konfiguriert ist und Ihre Dokumente weder das Sprach-META-Element noch das Sprachattribut für das <HTML> -Tag enthalten, können Sie Metadaten-Injektionen verwenden, um die entsprechende Sprache anzugeben.

Wie kommt es, dass ich die chinesischen, japanischen oder koreanischen PDF-Dateien auf meiner Website nicht durchsuchen kann?

Site-Suche/Merchandising ruft UTF-8 aus Adobe PDF-Dateien ohne Angabe der Sprache ab. Wenn Sie PDF Documents ( Settings > Crawling > Content Types ) ausgewählt haben, müssen Sie mithilfe der Metadaten-Injektionen die Sprache angeben, die in der PDF-Datei verwendet wird.

Wie kommt es, dass ich die chinesischen, japanischen oder koreanischen SWF-Dateien auf meiner Website nicht durchsuchen kann?

Site-Suche/Merchandising ruft UTF-8 aus Adobe Flash-Filmdateien ab, die ohne Angabe der Sprache mit Adobe Flash erstellt wurden. Wenn Sie den Inhaltstyp ausgewählt haben Adobe Flash Movies ( Settings > Crawling > Content Types ), müssen Sie mithilfe der Metadaten-Injektionen die Sprache angeben, die in der SWF-Datei verwendet wird.
Bei Flash-Versionen 4 oder älteren Versionen von SWF-Dateien wird der Zeichensatz der Zeichen in der Datei nicht angegeben. Wenn Sie den Inhaltstyp ausgewählt haben Adobe Flash Movies ( Settings > Crawling > Content Types ), müssen Sie den in der SWF-Datei verwendeten Zeichensatz mithilfe von Metadaten-Injektionen angeben.

Wie kommt es, dass ich die chinesischen, japanischen oder koreanischen Microsoft Office-Dateien auf meiner Website nicht durchsuchen kann?

Bei der Site-Suche/beim Merchandising wird UTF-8 aus Microsoft Office-Dateien (Microsoft Word, Microsoft Excel und Microsoft PowerPoint) ohne Angabe der Sprache abgerufen. Wenn Sie den Inhaltstyp ausgewählt haben Microsoft Office Files ( Settings > Crawling > Content Types ), müssen Sie mithilfe der Metadaten-Injektionen die Sprache angeben, die in den Microsoft Office-Dateien verwendet wird.

Wie kommt es, dass ich die chinesischen, japanischen oder koreanischen MP3-Dateien auf meiner Website nicht durchsuchen kann?

Wenn Sie den Inhaltstyp auswählen Text in MP3 Music Files ( Settings > Crawling > Content Types ), müssen Sie Metadaten-Injektionen verwenden, um den Zeichensatz anzugeben, mit dem die MP3-Dateien kodiert werden.

Muss ich etwas Besonderes tun, um die .txt-Dateien auf meiner Website korrekt zu indizieren?

Wenn Sie den Inhaltstyp ausgewählt haben Text Documents ( Settings > Crawling > Content Types ), müssen Sie Metadaten-Injektionen verwenden, um den Zeichensatz anzugeben, mit dem die .txt-Dateien kodiert werden.

Wie kommt es, dass chinesische, japanische oder koreanische Schriftarten in den Suchergebnissen unter Netscape 4.7 und früher erscheinen?

Wenn Ihr Konto die Standardvorlage, eine der gebrauchsfertigen Vorlagen oder eine Vorlage verwendet, die auf einer dieser Vorlagen basiert, kann es Schriftart-Tags enthalten, die Arial oder Helvetica als Schriftart angeben. Zum Beispiel <font face="arial, helvetica" size="+1"> . In Netscape 4.7 und früher werden keine chinesischen, japanischen oder koreanischen Zeichen angezeigt, wenn die Schriftart Arial oder Helvetica verwendet wird. Entfernen Sie das face Attribut oder ersetzen Sie die Schriftart durch eine, die für Chinesisch, Japanisch oder Koreanisch geeigneter ist.

Haben Sie Ihr Indexprotokoll geprüft?

Das Index-Protokoll enthält detaillierte Informationen, die der Site-Such-/Merchandising-Roboter beim Indizieren Ihrer Website erfasst. Das Protokoll enthält eine Liste mit durchgecrawenen Links und aufgetretenen Fehlern. Die Überprüfung des Index-Protokolls ist der beste Ausgangspunkt, um festzustellen, warum nicht alle Seiten auf Ihrer Website indiziert sind.

Haben Sie Tippfehler in Ihrer URL?

Wenn Sie längere URLs in HTML-Formulare eingeben, kann es zu einem oder mehreren Schreibfehlern kommen. Beachten Sie, dass URLs keine Leerzeichen enthalten dürfen. Beachten Sie außerdem, dass bei einigen Webservern die Groß- und Kleinschreibung bei URLs beachtet wird.
Klicken Sie im Produktmenü auf Settings > Crawling > URL Entrypoints . Überprüfen Sie auf der Staged URL Entrypoints Seite Folgendes:
  • Sie haben keine typografischen Fehler in Ihren URLs.
  • Die Zeichen in den URLs verwenden alle das richtige Gehäuse.
  • Die URLs enthalten keine Leerzeichen.
Um Ihre URL-Einstiegspunkte zu testen, kopieren Sie eine URL und fügen Sie sie in einen Webbrowser ein, um zu sehen, ob Ihre Website angezeigt wird. Wenn sie nicht angezeigt wird, überprüfen Sie erneut, um sicherzustellen, dass Sie keine Fehler im URL-Pfad gemacht haben.

Verfügt die Einstiegspunkt-Webseite über Links zu anderen Seiten Ihrer Website?

Der Site-Such-/Merchandising-Roboter durchsucht Ihre Website genau wie Ihr Kunde. durch Befolgen von Links von Seite zu Seite. Links müssen auf der Einstiegsseite vorhanden sein, bevor der Suchroboter andere Seiten auf Ihrer Site finden und indizieren kann.

Sind Links zu anderen Seiten Ihrer Website in JavaScript eingebettet?

Sie können ausgefeilte Navigationstechniken auf Ihrer Website verwenden, z. B. Rollover-Aktionen und Menüs, bei denen JavaScript zur Verknüpfung mit anderen Seiten verwendet wird. Der Site-Such-/Merchandising-Roboter kann jedoch keine in JavaScript eingebetteten Links verfolgen.
Eine Lösung, die Sie zur Behebung dieses Problems verwenden können, besteht darin, versteckte Links zu anderen Seiten im HTML-Code zu platzieren, die das JavaScript enthalten. Obwohl Kunden auf Ihrer Website diese Links nicht sehen, findet und durchsucht der Suchroboter sie immer noch. Sie können verborgene Tags am unteren Rand der Seite direkt vor dem </body> Tag platzieren. Sie können wie folgt aussehen:
<a href="/mydir/mypag1.html"></a> 
<a href="/mydir/mypag2.html"></a>

Eine andere Lösung besteht darin, die URLs der zusätzlichen Seiten auf Ihrer Website als Einstiegspunkte für Crawl und Index aufzulisten. Beginnen Sie mit den URLs, https:// wie im Folgenden gezeigt:
https://www.mydomain.com/mydir/mypag1.html 
https://www.mydomain.com/mydir/mypag2.html

Sind die HTML-Tags auf Ihrer Webseite in einer ungültigen Reihenfolge?

Die HTML-Spezifikation erfordert, dass die <html> -, <head> - und <body> -Tags einer bestimmten Sequenz in einem HTML-Dokument folgen. Tags auf allen Webseiten müssen die folgende Reihenfolge aufweisen:
<html> 
<head> 
...  
<i>head tags go here</i> ... 
</head> 
<body> 
...  
<i>body tags go here</i> ... 
</body> 
</html>

Wenn die HTML-Tags nicht in der richtigen Reihenfolge angeordnet sind, kann der Site-Such-/Merchandising-Roboter Ihre Webseite nicht richtig analysieren und indizieren. Im Folgenden finden Sie ein Beispiel für Tags, die sich nicht in der richtigen Reihenfolge befinden:
<body> 
<head> 
...  
<i>head tags are here</i> ... 
</head> 
...  
<i>body tags are here</i> ... 
</body>

In diesem Fall platzieren Sie die Tags <html> , <head> und <body> in der richtigen Reihenfolge auf Ihrer Webseite.

Haben Sie auf Ihrer Webseite falsch formatierte HTML-Kommentar-Tags?

Stellen Sie sicher, dass Sie ungültige HTML-Kommentare auf Ihren Webseiten sorgfältig überprüfen und korrigieren.
Die HTML-Spezifikation erfordert, dass ein HTML-Kommentar mit den Zeichen beginnt <!-- und mit den Zeichen endet --> . Es ist einfach, falsch formatierte Kommentare zu übersehen, die dazu führen, dass der Site-Such-/Merchandising-Roboter die Tags auf Ihrer Webseite falsch analysiert. Ein falsch formatierter Kommentar kann dazu führen, dass der Site-Such-/Merchandising-Roboter andere wichtige Tags verpasst, die analysiert werden müssen. Achten Sie auf Kommentare kurz vor dem <body> Tag in Ihrer Webseite.
Im Folgenden finden Sie ein Beispiel für einen ordnungsgemäß formatierten Kommentar:
<!-- This HTML comment is OK. -->
Im Folgenden finden Sie ein Beispiel für fehlerhafte Kommentare:
<!- This HTML comment is improperly formed. -> 
<! This HTML comment is also improperly formed. >

Enthält Ihre Webseite Links zu Seiten in einer anderen Domäne?

Oft kann eine Website aus Seiten bestehen, die tatsächlich auf einem Webserver mit einer anderen Domänenadresse vorhanden sind. Wenn Ihre Haupt-Website-Adresse beispielsweise folgende ist:
https://www.mydomain.com/
Ihre Website kann auch Seiten in einer anderen Domäne wie der folgenden enthalten:
https://www.otherdomain.com/
Standardmäßig folgen die Links des Site-Such-/Merchandising-Roboters nicht auf einer anderen Domäne als der Hauptdomäne. Indem Sie jedoch zusätzliche Einstiegspunkte für Ihr Suchkonto festlegen, können Sie problemlos mehrere Domänen indizieren.
Klicken Sie im Produktmenü auf Settings > Crawling > URL Entrypoints . Fügen Sie die "Haupt-Website-Einstiegspunkt"-URL Ihrer Site hinzu. Fügen Sie dann weitere URL-Einstiegspunkte zu allen anderen Domänen hinzu, die Siteseiten enthalten. Sie würden z. B. Ihren URL-Haupteinstiegspunkt auf Folgendes setzen:
https://www.mydomain.com/
und fügen Sie den folgenden zusätzlichen Site-URL-Einstiegspunkt hinzu:
https://www.otherdomain.com/

Verwenden Sie einen virtuellen Domänendienst für Ihre URL?

Möglicherweise verwenden Sie einen virtuellen Domänendienst (manchmal auch als "Domänenumleitungsdienst"bezeichnet), um eine bessere URL für Kunden bereitzustellen, die zu Ihrer Website gelangen. Angenommen, die Adresse Ihrer Website lautet wie folgt:
https://www.myispdomain.com/~myname/mywebpages/
Sie verwenden jedoch einen virtuellen Domänendienst, damit Kunden unter folgenden Adressen zu Ihrer Site gelangen können:
https://myname.adomain.com/
oder
https://adomain.com/myname/
Standardmäßig folgen die Links des Site-Such-/Merchandising-Roboters nicht auf einer anderen Domäne als der Hauptdomäne. Indem Sie jedoch zusätzliche Einstiegspunkte für Ihr Suchkonto festlegen, können Sie problemlos mehrere Domänen indizieren.
Klicken Sie im Produktmenü auf Settings > Crawling > URL Entrypoints . Fügen Sie den "Haupt-URL-Einstiegspunkt"zum Namen der virtuellen Domäne Ihrer Site hinzu. Fügen Sie dann der Domäne, in der sich Ihre Website befindet, weitere Einstiegspunkte hinzu.
Sie würden z. B. den Haupteinstiegspunkt der URL auf Folgendes setzen:
https://myname.adomain.com/
Fügen Sie den folgenden zusätzlichen URL-Einstiegspunkt der Website hinzu:
https://www.myispdomain.com/~myname/mywebpages/

Verwendet Ihre Webseite ein Meta-Aktualisierungs-Tag?

Viele Websites haben eine Titelseite, die ein Meta-Aktualisierungs-Tag zwischen den <head>...</head> Tags enthält, ähnlich dem Folgenden:
<meta http-equiv="Refresh" content="0;URL=https://www.adomain.com/apath/afile.html">
Unter bestimmten Umständen ist der Site-Suchroboter/Merchandising nicht in der Lage, der Meta-Aktualisierungs-URL zu folgen, um den Inhalt Ihrer Website zu indizieren. Dieses Problem lässt sich einfach umgehen, indem Sie zusätzliche Einstiegspunkte festlegen.
Klicken Sie im Produktmenü auf Settings > Crawling > URL Entrypoints . Fügen Sie der URL des Meta-Aktualisierungstag einen weiteren Einstiegspunkt hinzu.

Verwendet Ihre Webseite ein Meta-Roboter-Tag?

Manchmal verwenden Webseiten Meta-Robots-Tags, um Webroboter zu steuern, die regelmäßig versuchen, eine Website zu durchsuchen. Meta-Roboter-Tags erscheinen zwischen den <head>...</head> Tags einer Webseite und sehen ähnlich wie das folgende Tag aus:
<meta name="robots" content="noindex, nofollow">
Da der Site-Such-/Merchandising-Roboter selbst ein Webroboter ist, folgt er den Anweisungen des Meta-Roboter-Tags. Indem Sie andere Roboter auf diese Weise ausschließen, schließen Sie auch den Site-Such-/Merchandising-Roboter aus.
Weitere Informationen zu Webrobotern und dem Roboter-Ausschlussprotokoll finden Sie unter:
Entfernen oder ändern Sie das Meta-Robots-Tag auf den Webseiten, die Sie auf Ihrer Website indizieren möchten.

Verwendet Ihre Website eine Ausschlussdatei für Roboter?

Manchmal hat eine Website eine Seite namens "robots.txt", die alle oder bestimmte Roboter vom Crawling ausschließt. Um zu sehen, ob Ihre Website eine Datei "robots.txt"enthält, suchen Sie diese direkt unter der Domäne der obersten Ebene, wie im Folgenden gezeigt:
https://www.yourdomain.com/robots.txt
Der Inhalt der Datei "robots.txt"ähnelt dem folgenden Text:
User-agent: * 
Disallow: /

Da der Site-Such-/Merchandising-Roboter selbst ein Webroboter ist, folgt er den Anweisungen in der Datei "robots.txt". Er schließt den Site-Such-/Merchandising-Roboter aus. Um dieses Problem zu umgehen, bearbeiten Sie die Ausschlussdatei für Roboter (robots.txt), damit der Site-Such-/Merchandising-Roboter Ihre Website wie folgt durchsuchen und indizieren kann:
User-agent: Atomz/1.0 
Disallow: 
 
User-agent: * 
Disallow: /

Microsoft Office

Eine Seite mit häufig gestellten Fragen, die die Unterstützung der Indizierung und Suche von Microsoft® Office-Dateien auf einer Website behandelt.
Im Folgenden werden häufig gestellte Fragen zu Microsoft Office-Dateien aufgeführt:

Was wird in einer Microsoft Office-Datei indiziert?

Der vollständige Inhalt von Microsoft Word-, Microsoft Excel- und Microsoft PowerPoint-Dateien wird indiziert.
Die folgenden Teile einer Microsoft Word-Datei werden indexiert:
  • Titel
  • Keywords
  • Betreff (Beschreibung)
  • Textbasierter Inhalt
  • Hyperlinks zu anderen Dokumenten
Die folgenden Teile einer Microsoft Excel-Datei werden indexiert:
  • Titel
  • Keywords
  • Betreff (Beschreibung)
  • Text in Zellen
  • Werte aus numerischen Formeln in Zellen
Die folgenden Teile einer Microsoft PowerPoint-Datei werden indexiert:
  • Titel
  • Keywords
  • Betreff (Beschreibung)
  • Text auf jeder Folie

Was wird nicht in einer Microsoft Office-Datei indiziert?

Grafiken, die in Microsoft Office-Dateien enthalten sind, oder Text, der Teil einer enthaltenen Grafik ist, werden nicht indiziert. Benutzerdefinierte Eigenschaftsdefinitionen werden nicht als Metadaten indiziert. Einige Texte in speziellen Feldern, wie Kopf- und Fußzeilen in einer PowerPoint-Datei, werden ebenfalls nicht indiziert.

Wie unterscheiden sich Microsoft Office-Dateien von HTML-Seiten?

Der Unterschied zwischen der Indizierung von Microsoft Office- und HTML-Dateien durch den Suchroboter besteht darin, dass jede HTML-Datei eine einzelne Seite und eine einzelne Microsoft Office-Datei Hunderte von Seiten darstellen kann. Aus diesem Grund wird jede Seite in einer Microsoft Office-Datei als separate Seite unter Ihrem Suchkonto gezählt.

Wie kann ich verhindern, dass Microsoft Office-Dateien auf meiner Website indiziert werden?

Wenn Sie nicht möchten, dass der Suchroboter Microsoft Office-Dateien durchsucht und indiziert, deaktivieren Sie die Auswahl des Inhaltstyps Microsoft Office Files ( Settings > Crawling > Content Types ).
Sie können die Indizierung von Microsoft Office-Dateien auch deaktivieren URL Masks lassen.
Geben Sie die folgenden URL-Masken ein:
Wenn Sie keine regulären Ausdrücke verwenden
  • exclude *.doc
  • exclude *.xls
  • exclude *.ppt
Wenn Sie reguläre Ausdrücke verwenden
  • exclude regexp ^.*\\.doc$
  • exclude regexp ^.*\\.xls$
  • exclude regexp ^.*\\.ppt$

Wann wird eine MP3-Datei durchsucht und indiziert?

MP3-Dateien werden auf zweierlei Weise durchsucht und indiziert. Am häufigsten erfolgt die Eingabe über ein Anker-href-Tag in einer HTML-Datei:
<a href="MP3-file-URL"></a>
Eine zweite Möglichkeit besteht darin, die URL der MP3-Datei als URL-Einstiegspunkt einzugeben.

Was muss ich tun, um die MP3-Dateien auf meiner Site zu durchsuchen und zu indizieren?

Klicken Sie zum Aktivieren des Crawling- und Indizierens von MP3 für Ihr Konto im Produktmenü auf Settings > Crawling > Content Types . Wählen Sie auf der Staged Content Types Seite Text in MP3 Music Files .

Wie wird eine MP3-Datei erkannt?

Eine MP3-Datei wird durch ihren MIME-Typ "audio/mpeg"erkannt.

Was ist in einer MP3-Datei indiziert?

MP3-Dateien speichern optional eine kleine Menge an Textinformationen. Diese Informationen können den Namen des Albums, den Namen des Künstlers, den Titel des Liedes, das Musikgenre, das Jahr der Veröffentlichung und einen Kommentar enthalten. Diese Informationen werden am Ende der Datei im so genannten TAG gespeichert. MP3-Dateien, die TAG-Informationen enthalten, werden wie folgt indiziert:
  • Der Titel des Liedes wird wie der Titel einer HTML-Seite behandelt.
  • Der Kommentar wird wie eine für eine HTML-Seite definierte Beschreibung behandelt.
  • Das Genre wird wie ein für eine HTML-Seite definierter Suchbegriff behandelt.
  • Der Name des Künstlers, der Name des Albums und das Jahr der Veröffentlichung werden wie der Text eines HTML-Dokuments behandelt.

Zählt eine MP3-Datei als Seite?

Ja, jede MP3-Datei, die auf Ihrer Website durchsucht und indiziert wird, wird als eine Seite gezählt.

Wie kann ich die Indizierung einzelner MP3-Dateien verhindern?

Umschließen Sie die Anker-Tags, die mit den MP3-Dateien mit <nofollow> und </nofollow> -Tags verknüpft sind. Der Suchroboter folgt nicht den Verknüpfungen zwischen diesen Tags.
Eine andere Methode besteht darin, die URLs der MP3-Dateien als Ausschlussmasken hinzuzufügen.
Siehe URL-Masken .
Siehe Skript "URL-Masken" .

Wie kann ich verhindern, dass MP3-Dateien indiziert werden?

Die einfachste Möglichkeit, die MP3-Indizierung für Ihr Konto zu steuern, ist die Deaktivierung Text in MP3 Music Files auf der Staged Content Types Seite.
Sie können auch die Funktion "URL-Masken"verwenden, um die MP3-Indexierung nach Dateierweiterung zu deaktivieren. Klicken Sie dazu im Produktmenü auf Settings > Crawling > URL Masks . Geben Sie eine der folgenden Masken ein:
Wenn Ihr Konto...
Geben Sie die folgende URL-Maske ein
Keine regulären Ausdrücke
exclude *.mp3
Verwendet reguläre Ausdrücke
exclude regexp ^.*\.mp3$

Warum kann ich die chinesischen, japanischen oder koreanischen MP3-Dateien auf meiner Site nicht durchsuchen?

Um nach chinesischen, japanischen oder koreanischen MP3-Dateien zu suchen, klicken Sie im Produktmenü auf Settings > Crawling > Content Types > Text in MP3 Music Files . Klicken Sie dann auf Settings > Metadata > Injections und geben Sie den Zeichensatz an, der zum Kodieren der MP3-Dateien verwendet wird.

Was wird in einer PDF-Datei indiziert?

Der gesamte Inhalt von PDF-Dateien wird indiziert. Die folgenden Teile einer PDF-Datei werden indexiert:
  • Titel
  • Keywords
  • Betreff (Beschreibung)
  • Textbasierter Inhalt

Was wird nicht in einer PDF-Datei indiziert?

Das PDF-Inhaltsverzeichnis, Grafiken in der Datei oder Text, der Teil einer enthaltenen Grafik ist, werden nicht indiziert.

Wie werden indizierte PDF-Dateien gezählt?

Jede PDF-Datei, einschließlich PDF-Dateien mit mehreren Seiten, wird als ein einziges Dokument gezählt.

Können die Suchergebnisse ein PDF-Symbol anzeigen?

Ja. Verwenden Sie das <search-if-link-extension> -Tag in Ihrer Vorlage, um ein PDF-Symbol oder andere Grafiken oder Text in die Suchergebnisse einzuschließen:
<search-results> 
  ... 
  <search-if-link-extension value=".pdf"> 
    <img src="/search/i/pdficon.gif"> 
  </search-if-link-extension> 
  ... 
</search-results>

PDF-Symbole helfen Ihren Kunden zu wissen, dass ein Suchergebnis mit einer PDF-Datei verknüpft ist, die sehr groß sein kann. Die Dateigröße kann für Kunden von Bedeutung sein, die über ein Modem oder ein Mobilgerät auf Ihre Website zugreifen.

Können die Suchergebnisse mit einer bestimmten Seite in einer PDF-Datei verknüpft werden?

Ja. Mithilfe des Vorlagen-Tags für intelligente Links ( <search-smart-link>...</search-smart-link> ) können Kunden auf die erste PDF-Seite klicken, die das Suchergebnis enthält.
Um intelligente Links zu verwenden, ersetzen Sie die <search-link>...</search-link> Tags im Suchergebnisbereich Ihrer Vorlage durch <search-smart-link>...</search-smart-link> Tags. Wenn ein Kunde auf einen Link klickt, den die Smart-Link-Tags erzeugen, wird die erste PDF-Seite aufgerufen, die für die Suchanfrage relevant ist.
Um diese Funktion verwenden zu können, muss der Kunde eine aktuelle Version von Adobe Acrobat oder Adobe Acrobat Reader verwenden, die das Hervorhebungs-Plug-In und das externe Window Handler-Plug-In (EWH) enthalten muss. Darüber hinaus muss der Webbrowser das Adobe Acrobat-Plug-in für Netscape Navigator (Sie können jeden Browser verwenden, der dieses Netscape Navigator-Plug-In akzeptiert) oder das Acrobat ActiveX-Steuerelement für Internet Explorer 4.0 und höher verwenden.

Wie kann ich verhindern, dass PDF-Dateien auf meiner Website indiziert werden?

Wenn Sie nicht möchten, dass der Suchroboter PDF-Dateien durchsucht und indiziert, deaktivieren Sie die Auswahl des Inhaltstyps PDF Documents ( Settings > Crawling > Content Types ).
Sie können auch die PDF-Indexierung deaktivieren URL Masks lassen.
Um die PDF-Indexierung zu deaktivieren, geben Sie eine der folgenden URL-Masken ein:
  • exclude *.pdf (wenn Sie keine regulären Ausdrücke verwenden)
  • exclude regexp ^.*\.pdf$ (wenn Sie reguläre Ausdrücke verwenden)

Wie kommt es, dass ich die chinesischen, japanischen oder koreanischen PDF-Dateien auf meiner Website nicht durchsuchen kann?

Site-Suche/Merchandising ruft UTF-8 aus PDF-Dateien ohne Angabe der Sprache ab. Wenn Sie den Inhaltstyp ausgewählt haben PDF Documents ( Settings > Crawling > Content Types ), müssen Sie mithilfe der Metadaten-Injektionen die Sprache angeben, die in der PDF-Datei verwendet wird.

Zu viele Seiten

Auf der Seite mit häufig gestellten Fragen werden einige Gründe erläutert, warum der Indexer mehr Seiten gezählt hat, als Sie tatsächlich haben, und wie die Lösung in jedem Fall aussieht.
Wenn Sie sicher sind, dass Ihre Website unter Ihrer Seitenbegrenzung liegt, der Indexer Ihnen jedoch mitteilt, dass die Grenze erreicht ist, sollten Sie diese allgemeinen Fragen und Antworten auf mögliche Lösungen überprüfen.

Haben Sie Ihre verschiedenen Indexprotokolle geprüft?

Das Index-Protokoll enthält detaillierte Informationen, die vom Site-Such-/Merchandising-Roboter gesammelt wurden, während es Ihre Website indiziert. Das Protokoll enthält eine Liste aller gecrawlen Links und der aufgetretenen Fehler. Das Überprüfen des Indexprotokolls ist der beste Ausgangspunkt, wenn Sie ermitteln möchten, welche Seiten indiziert werden.

Werden CGI-Programme auf Ihrer Website indiziert?

CGI-Programme verwenden URL-Parameter, die manchmal dazu führen, dass der Indexer mehrere "gefälschte"URLs durchsucht. Wenn Site-Suche/Merchandising Ihre CGI-Programme liest und URLs mit CGI-Parametern folgt, gibt es wahrscheinlich mehrere Vielfache von Seiten, die durchsucht und indiziert werden, die für Ihren Suchindex nicht nützlich sind. Typische CGI-Parameter werden in URLs mit ? oder & Zeichen angezeigt.
Mithilfe der Funktion "URL-Masken"können Sie die CGI-Programme vor der Indexierung maskieren. Sie können ein URL-Präfix maskieren oder reguläre Ausdrücke verwenden, um Ihre CGI-Skripte zu maskieren.
Siehe URL-Masken .
Siehe Skript "URL-Masken" .

Ist das Durchsuchen von Ordnern auf Ihrem Server aktiviert?

Wenn auf einem Webserver das Durchsuchen von Ordnern aktiviert ist und in einem bestimmten Verzeichnis keine Datei "index.html"vorhanden ist, kann ein Besuch dieses Ordners die Auflistung der Dateien in diesem Verzeichnis anzeigen. Normalerweise befinden sich Links am oberen Rand der Seite, mit denen Sie die Liste auf unterschiedliche Weise sortieren können, indem Sie einfach auf Name , Last modified , Size usw. klicken. Normalerweise erscheinen diese im Site-Index-Protokoll für Suche/Merchandising als URLs mit Zeichen wie ?M=A am Ende. Der Site-Such-/Merchandising-Impulszähler folgt diesen als Links, was dazu führen kann, dass mehrere "gefälschte"URLs indiziert werden.
Normalerweise enthält eine gut konzipierte Website entweder Indexdateien in jedem Verzeichnis, oder das Durchsuchen von Ordnern ist für Ordner ohne Indexdateien deaktiviert. Glücklicherweise gibt es eine einfache Möglichkeit, diese "gefälschten"URLs zu maskieren, wenn Sie Ihre Seiten nicht ändern oder Ordnerauflistungen auf der Serverseite deaktivieren können.
Klicken Sie zum Ausführen dieser Aufgabe auf Settings > Crawling > URL Masks . Fügen Sie eine Maske hinzu, um alle URLs zu maskieren, die das Zeichen enthalten ? . Sie können diese Aufgabe ausführen, indem Sie die folgende Maske für reguläre Ausdrücke eingeben:
exclude regexp ^.*\?.*$
Nachdem Sie die Maske erstellt haben, stellen Sie sicher, dass Sie Ihre Website neu indizieren.

Gibt es Foren oder Newsgruppen auf Ihrer Website?

Wenn Foren oder Newsgruppen auf Ihrer Website durchsucht werden, können URLs für verschiedene Anzeigeoptionen oder Sortieroptionen folgen. Dieses Verhalten bedeutet, dass dieselbe Seite mehrmals indiziert wird.
In der Regel verfügen Foren oder Newsgroups über eigene Suchmaschinen. In diesem Fall können Sie die Foren URL Masks von der Site-Suche/dem Merchandising maskieren.
Klicken Sie im Produktmenü auf Settings > Crawling > URL Masks . Maskieren Sie Ihre Foren auf der Staged URL Masks Seite, indem Sie ihre URLs als URL-Masken ausschließen eingeben.
Nachdem Sie die Masken erstellt haben, stellen Sie sicher, dass Sie Ihre Website neu indizieren.

Gibt es PDF- oder Microsoft Office-Dateien auf Ihrer Website?

Wenn sich auf Ihrer Website PDF-Dateien oder Microsoft Office -Dateien befinden, wird die Indexgröße von nur wenigen Dateien möglicherweise viele Seiten umfassen. Es werden mehr Seiten indiziert als Dokumente, weil jede Seite in einer PDF- oder Microsoft Office-Datei als separate Seite gezählt wird.
Klicken Sie im Produktmenü auf Index > Full Index > Live Index . Wählen Sie auf der Full Index Seite Count All Pages und klicken Sie dann auf Full Index Now , um die Gesamtanzahl der Seiten anzuzeigen. Wenn PDF- oder Microsoft Office-Dateien nicht indiziert werden sollen, können Sie diesen Inhaltstyp unter Settings > Crawling > Content Types .

Haben Sie mehrere URL-Einstiegspunkte?

Der Site-Such-/Merchandising-Roboter beginnt mit dem Crawling an bestimmten URL-Einstiegspunkten und folgt allen gefundenen Links zu allen Inhalten in dieser bestimmten Domäne. Wenn Sie viele URL-Einstiegspunkte angegeben haben, wird möglicherweise eine erhebliche Anzahl von Seiten durchsucht.
Verwenden Sie das nofollow Tag des Robots-Ausschlussprotokolls in den Kopfzeilen der Einstiegspunktdokumente auf den zusätzlichen Domänen wie folgt:
<html> 
<head> 
<meta name="robots" content="nofollow"> 
</head>

Der obige Code weist den Site-Such-/Merchandising-Roboter an, den Inhalt der Seite zu indizieren, aber nicht den Links zu zusätzlichen Seiten zu folgen.
Weitere Informationen zu Webrobotern und dem Roboter-Ausschlussprotokoll finden Sie unter:
Wenn Sie keinen Zugriff auf die Quelle der Seiten auf zusätzlichen Domänen haben, können Sie die Einstiegspunkte für mehrere URLs entfernen. Auf diese Weise können Sie die Indexierungsaktivität nur auf die Domänen beschränken, deren Inhalt Sie von Kunden durchsuchen können möchten.

Haben Sie die internen Bytes oder Zeitlimits für die Site-Suche/das Merchandising überschritten?

Überprüfen Sie im Bildschirm "Vollständiger Indexstatus", ob Ihr Konto seine Grenze erreicht hat. Wenn der Status meldet, dass Ihr Index größer als erlaubt ist oder dass es länger dauerte als erlaubt, wird Ihre Website nicht vollständig indiziert. Sie können diesen Fehler korrigieren, damit Sie eine angemessene Abdeckung und Anzahl der Webseiten erhalten.
Zum Schutz der Site-Such-/Merchandising-Server gibt es interne Beschränkungen für Bytes und Zeit. Nur wenn durchgekrackte Dateien sehr groß sind oder wenn der Server, auf den Site-Suche/Merchandising versucht, langsam erreicht wird, werden diese Beschränkungen erreicht.
Wenn Sie eine Zeitbegrenzung erreicht haben, stellen Sie sicher, dass Ihr Server online ist, und versuchen Sie den Index zu einem späteren Zeitpunkt erneut. Wenn Sie die maximale Anzahl an Bytes erreichen, überprüfen Sie die durchgecrawenen Dateien, indem Sie Ihr Indexprotokoll anzeigen. Sind sie ungewöhnlich groß? Wenden Sie sich an den technischen Support, wenn eine dieser Meldungen angezeigt wird.