Show Menu
主题×

关于增量索引

您可以使用增量索引为实时网站或分阶段网站的“片段”(如频繁更改的页面的集合)编制索引。

使用增量索引

增量索引只需几秒即可执行,对于需要数小时才能完全索引的大容量网站非常有用。
生成增量索引时,会显示状态信息,如开始时间、已用时间和索引过程中的错误。 还会显示有关上一个索引状态的信息。
您可以随时停止或重新启动增量索引创建过程。
当新增索引为实时网站构建时,客户可以使用您的上次增量索引继续搜索您的网站。

配置分阶段网站的增量索引

您可以通过指定网站URL和URL蒙版来配置要包含在增量索引中的网站页面。
配置分阶段网站的增量索引
  1. 在产品菜单中,单击 Index > Incremental Index > Configuration ​。
  2. 在页 Incremental Index Configuration 面上,使用各种字段指定要索引的页面。
    字段
    描述
    添加或更新URL
    指定URL。
    搜索自动机仅对自您上次编制索引以来已更改的指定文档进行索引。
    此外,搜索机器人会遵循包含在指定文档中的链接,并仅对那些已更改的文档进行索引。
    此字段必须仅包含文档URL,而不能包含蒙版,如下例所示:
    https://www.mydomain.com/products/new.html
    您可以将以下关键字与URL一起使用:
    • noindex
      如果不想为页面上与指定URL匹配的文本编制索引,但想要跟踪页面链接,请添加 noindex 在URL之后,如下例所示:
      https://www.mydomain.com/products/new.html索引
      请务必将 noindex 从含空格的URL;逗号不是有效的分隔符。
    • nofollow
      如果要为页面上与指定URL匹配的文本编制索引,但不想跟随页面链接,请添加 nofollow 在URL之后,如下例所示:
      https://www.mydomain.com/products/new.html了解详情
      请务必将 nofollow 从含空格的URL;逗号不是有效的分隔符。
    查找和更新URL蒙版
    指定简单的URL蒙版——完整路径、部分路径或使用通配符或正则表达式的路径。
    搜索自动机仅查找自您上次编制索引以来已更改的所有匹配文档和索引。
    此外,搜索自动机遵循包含在匹配文档中的链接,并仅对那些已更改的页面进行索引。 例如:
    https://www.mydomain.com/products/household/*.html
    您还可以使用正则表达式,如以下示例所示:
    regexp^https://www\.mydomain\.com/products/houseld/.*\.html$
    请参阅 正则表达式
    您还可以使用关键字 nofollow noindex 如以上“添 加或更新URL”中 所述。
    包括和排除URL蒙版
    指定简单的包含或排除URL蒙版——完整路径、部分路径或使用通配符或正则表达式的路径。
    搜索自动机根据指定的蒙版类型查找和索引(“include”)文档或忽略(“exclude”)文档。
    在为站点编制索引时,将按照外观的顺序按方向进行操作。 例如,以下蒙版列表:
    包括https://www.mydomain.com/products/household/lightbulbs*.html
    排除https://www.mydomain.com/products/
    索引页面 lightbegles1.html lightbegles2.html 。但是,它不会为products目录下列出的任何其他页面编制索引。
    首先显示的URL蒙版始终优先于稍后在列表中显示的URL蒙版。 此外,如果搜索机器人遇到与包含蒙版和排除蒙版两者匹配的文档,则首先列出的蒙版优先。
    您还可以使用关键字 nofollow noindex 如以上“添 加或更新URL”中 所述。
    请参阅 关于URL蒙版
    包括和排除日期蒙版
    指定简单的包含或排除日期蒙版——完整路径、部分路径或使用通配符或正则表达式的路径。
    搜索自动机根据URL和文档的日期查找和索引(“include”)文档或忽略(“exclude”)文档。
    您可以使用以下类型的日期蒙版:
    • include-days NNN
      搜索自动机为与指定的URL蒙版匹配且版本为NNN(天数)或更久的所有文档建立索引。
      您可以使用以下一个或多个关键字在URL蒙版后跟踪:
      • nofollow
      • noindex
      • server-date
      例如,以下蒙版包括/archive/support文件夹中0天或更早的所有文档:
      include-days 0 https://www.mydomain.com/archive/support/
    • include-date YYYY-MM-DD
      搜索自动机为与指定URL蒙版匹配且旧或旧于YYYY-MM-DD日期的所有文档编制索引。
      您可以使用以下一个或多个关键字在URL蒙版后跟踪:
      • nofollow
      • noindex
      • server-date
      以下蒙版示例包括/archive/文件夹中日期为2011年7月25日或之前的所有文档:
      include-date 2011-07-25 https://www.mydomain.com/archive/
    • exclude-days NNN
      禁用所有与指定的URL蒙版匹配且版本为NNN天或更早的文档的索引。
      或者,您也可以选择按关键字使用URL蒙版 server-date .
      以下蒙版示例从索引中排除所有90天或更早的PDF文件:
      exclude-days 90 *.pdf
    • exclude-date YYYY-MM-DD
      禁用所有与指定的URL蒙版匹配且旧或早于日期YYYY-MM-DD的文档的索引。
      或者,您也可以选择按关键字使用URL蒙版 server-date .
      以下蒙版示例不包括2004年4月23日或之前/archive/文件夹中的所有文档:
      exclude-date 2004-04-23 https://www.mydomain.com/archive/
    删除URL
    指定URL。
    搜索自动机会从搜索索引中查找并删除指定的文档。 如果指定的页面已在您的搜索索引中,则自动机会在添加或更新任何其他页面之前将其删除。
    此字段只能包含文档URL,而不能包含蒙版。
    查找和删除URL蒙版
    指定简单的URL蒙版——完整路径、部分路径或使用通配符或正则表达式的URL蒙版。
    如果指定的URL蒙版与搜索索引中的页面匹配,则搜索自动机会在添加或更新任何其他页面之前删除这些页面。 例如:
    https://www.mydomain.com/products/1998/household/*
    您还可以使用正则表达式,如以下示例所示:
    regexp^https://www\.mydomain\.com/products/199[567]/。*$
    请参阅 正则表达式
  3. 单击 Save Changes .
  4. (可选)执行下列操作之一:

为实时网站设置增量索引计划

您可以选择增量索引频率和用于抓取和更新增量索引的基本时间。
您选择的时间是根据帐户设置中配置的时区所在的本地时间。
Web服务器通常安排在半夜停工进行维护。 如果服务器在计划的索引时间内关闭,则索引构建过程将失败。 请确保选择一天中Web服务器可用的时间。
索引计划仅适用于您的实时索引;无法计划分阶段的索引。
为实时网站设置增量索引计划
  1. 在产品菜单中,单击 Index > Incremental Index > Live Schedule ​。
  2. 在页面中 Incremental Index Schedule 的下拉列 Incrementally Index 表中,选择索引频率(以小时或分钟为单位)。
  3. 在下 Base Time 拉列表中,选择要重新生成新增量索引的开始时间。
  4. 单击 Save Changes .

运行实时或分阶段网站的增量索引

您可以使用增量索引为实时网站或分阶段网站的“片段”(如频繁更改的页面的集合)编制索引。
运行实时网站或分阶段网站的增量索引
  1. 在产品菜单中,执行下列操作之一:
    • 单击 Index > Incremental Index > Live Index .
    • 单击 Index > Incremental Index > Staged Index .
  2. 单击 Incremental Index Now .
  3. (可选)如果出现索引错误,请单 View Errors 击以查看关联的日志。

查看实时网站或分阶段网站的增量索引日志

当实时增量索引或分阶段增量索引完成时,您可以查看其关联日志以排除发生的任何错误。
您无法导出日志,也无法保存它们。 新索引出现之前,日志一直可供查看。
查看实时网站或分阶段网站的增量索引日志
  1. 在产品菜单中,执行下列操作之一:
    • 单击 Index > Incremental Index > Live Log .
    • 单击 Index > Incremental Index > Staged Log .
  2. 在日志页面顶部或底部,执行下列任一操作:
    • 使用导航选 First ​项、 Prev ​、 Next ​、 Last ​或 Go to line 在日志中移动。
    • 使用显示选 Errors only ​项 Wrap line ​或 Show 优化您看到的内容。