Show Menu
主題×

關於指令碼式索引

使用指令碼式索引,您可以編寫、更新和維護增量索引選項,而無需登錄。 搜索自動機從伺服器上托管的文本檔案中讀取說明。

使用指令碼索引

關於配置指令碼式增量索引

要使用指令碼式索引,請使用「指令碼式增量索引配置」頁來指定位於伺服器上的指令碼檔案(純文字檔案檔案)的URL。 例如, https://www.mysite.com/indexlist.txt 。當您的網站變更時,您可以手動或自動將指令區塊新增至文字檔案(新聞摘要、股票行情或其他變更檔案的資訊送達時,會觸發指令碼)。
當指令碼式增量索引開始時,搜索自動機讀取文本檔案並運行在該檔案中找到的新命令。 預設情況下,搜索自動機僅處理由檔案日期確定的新命令。 除非您在 Clear Date 配置指令碼索引時勾選,否則搜索自動機「記住」最近處理的塊的日期指定符。

關於指令碼檔案

您在URL中指定的指令碼檔案是位於伺服器上的純文字檔案。 您可以對行尾序列使用歸位、換行或兩者。 空白行包含零個或多個空格字元,後面接著行尾序列。 所有命令均不區分大小寫。
文本檔案以塊的形式組織,這些塊描述了搜索自動機在執行指令碼式增量索引時所使用的資訊。
區塊依日期排序,文字檔上方有最舊的區塊,下方有最新的區塊。 每個區塊都以單行date-command和date-specifier命令開始,並以空行分隔符號結束,如下列區塊範例所示(介於數個命令之間):
使用HTTP 1.1樣式時,低於10th的所有序數日期都需要前導零。 例如,11月6日是11月6日,而非11月6日。
命令
說明
date-command
每個塊的第一行以兩個日期命令之一開頭:
  • 日期
    使用「日期」命令指示日期指定符將由日、日、時和時區組成。
  • 使用 數表示日期指定符將包含一個時間(以紀元秒為單位)(例如784111777)。 使用秒 數時, 請確保塊之間的秒數增加。
日期指定符
期指定符 命令通常記錄將塊資訊添加到檔案的順序日期和時間(日期命令)或時間秒(秒命令)。 例如:
date Sun, 06 Nov 1994 08:49:37 GMT (HTTP 1.1 style) date Sunday, 06-Nov-94 08:49:37 GMT (HTTP 1.0 style) date Sun Nov 6 08:49:37 1994 (Unix asctime() date style) seconds 784111777 (Unix epoch-seconds style)
使用HTTP 1.1樣式時,低於10th的所有序數日期都需要前導零。 例如,11月6日是11月6日,而非11月6日。
搜尋自動機會「記住」最近處理過的區塊的日期指定字元,並僅索引其認為「較新」的資訊。 (即時對搜索機器人並不重要。 相反,與先前處理的時間相比的時間才是重要的。)
例如,搜索自動機讀取日期指定符為10:00 p.m的塊後,它不會讀取記錄時間在10:00 p.m.之前的任何塊,而不管索引操作何時運行。 在最壞的情況下,您可能會在日期指定字元中錯誤地輸入"2040",而非"2004"。 在這種情況下,搜索機器人在下次索引操作期間對2040塊進行索引,然後拒絕讀取任何其他資訊塊(除非有一個2040年後日期)。 如果發生此情況,請移除文字檔案中所有先前處理過的區塊,按一下「清 除日 期」,然後即時推送。
留言行
以"#"字元開始注釋行。
每條注釋行都必須是自己的行;您無法鍵入行章節附註釋。
注釋行不被視為空白行。 它也可以出現在區塊中的任何位置,即使是在日期或秒數命令之前,如下列範例所示:
    #Added by Cathy Read after the Y2K seminar     date Mon, 29 Dec 1999 09:32:20 GMT 
action-command
每個文本塊可以包含任意數量的操作命令。 以下action-command選項與標準增量索引的選項相對應:
  • 新增
    搭配URL使用。 搜索自動機僅對自上次索引操作以來更改的指定URL編製索引。 此外,搜索自動機會跟蹤包含在指定文檔中的連結,並僅對已更改的文檔進行索引。
    您可以在URL後面加上 nofollow noindex 關鍵字,如下列範例:
    add https://www.mydomain.com/ noindex
  • 更新
    搭配URL遮色片使用。 搜索自動機查找並更新與指定的URL蒙版匹配的所有文檔。
    您可以在URL後面加上 nofollow noindex 關鍵字,如下列範例:
    update https://www.mydomain.com/products/
  • 包括 排除
    搭配URL遮色片使用。 搜索自動機根據指定的掩碼類型查找和索引("include")或忽略("exclude")文檔。
    例如,
    include https://www.mydomain.com/products/household/lightbulbs*.html
    exclude https://www.mydomain.com/archive/
  • include-date exclude-date
    搭配URL遮色片使用。 搜索自動機根據URL和文檔日期查找和索引(「包含」)或忽略(「排除」)文檔。 可使用下列類型的遮色片:
    • 包含天數NNN
      搜索自動機為所有與指定的URL掩碼匹配且為NNN天或更舊的文檔編製索引。
      您可以跟隨URL遮色片和關鍵字 nofollow noindex 、和/或 server-date
    • include-date YYYY-MM-DD
      搜尋自動機會索引所有符合指定URL遮色片且舊版或舊版日期YYYY-MM-DD的檔案,其中"YYYY"是4位元年,"MM"是1或2位元月(1-12),"DD"是1或2位元日(1-31)。
      您可以跟隨URL遮色片和關鍵字 nofollow noindex 、和/或 server-date
    • exclude-days NNN
      禁用所有與指定的URL掩碼匹配且為NNN天或更舊的文檔的索引。
      您可以使用關鍵字跟隨URL遮色片 server-date
    • exclude-date YYYY-MM-DD
      停用符合指定URL遮色片且舊版或舊版日期YYYY-MM-DD之所有檔案的索引。
      您可以使用關鍵字跟隨URL遮色片 server-date
  • 刪除
    指定URL。 搜索自動機從由URL標識的索引中刪除文檔。
  • deletemask
    搜索自動機從與指定的URL掩碼匹配的索引中刪除文檔。
另請參閱 關於URL遮色片

指令碼檔案範例

在以下指令碼檔案示例中,如果日期指定符在日期之後是最近處理的塊的日期指定符,則搜索自動機將處理這些塊。 如果是,則會執行下列索引作業:
  • 從索 y2k-problems.html 引中刪除。
  • no-y2k-problems.html 增至搜尋索引,且不會跟隨任何連結 no-y2k-problems.html
  • 在搜尋時,從搜尋索引中排除 housewares.htm 符合 lightfixtures.htm 和l的URL。
  • 在下麵包含所有其他目錄和文檔 www.mydomain.com
  • 更新和目錄內的所 products 有文檔 information ,搜索和索引自上次索引操作以來更改的所有子連結。
  • 在編目時,如果URL的日 archive 期是1999年1月1日或之前,請排除網站區段中的URL。
  • 排除與搜尋索 housewares.html lightfixtures.html 相符的URL。
  • 為目錄中的檔案 help 編製索引,但不從這些檔案編目或為任何連結編製索引。
  • 搜索並索引為所遇到的任何其他檔案 www.mydomain.com
# Start of file. 
# Added by John Smith 
date Sat, 01 Jan 2004 16:05:53 PST 
exclude https://www.mydomain.com/housewares.html 
exclude https://www.mydomain.com/lightfixtures.html 
include https://www.mydomain.com/ 
delete https://www.mydomain.com/y2k-problems.html 
add https://www.mydomain.com/no-y2k-problems.html nofollow 
 
date Sun, 02 Jan 2004 20:19:08 PST 
# Added by the wire service updater 
exclude-date 1999-01-01 https://www.mydomain.com/archive server-date 
exclude https://www.mydomain.com/housewares.html 
exclude https://www.mydomain.com/lightfixtures.html 
include https://www.mydomain.com/help/ nofollow 
include https://www.mydomain.com/ 
# no add files, just update existing files 
# update all files in the "products" directory 
update https://www.mydomain.com/products/ 
# update all files in the "information" directory 
update regexp ^https://www\.mydomain\.com/information/.*$ 
# End of file.

配置指令碼式增量索引

您可以指定已建立的指令碼,該指令碼可以寫入、更新和維護增量索引,而無需登錄。 搜索自動機從伺服器上托管的文本檔案中讀取指令,以執行增量索引。
配置指令碼式增量索引
  1. 在產品功能表上,按一下 Index > Scripted Index > Configuration ​。
  2. 在頁 Scripted Incremental Index Configuration 面中,輸 Script File URL ​入位於伺服器上的文本檔案指令碼的URL。
  3. (可選)如 Clear Date 果不希望搜索自動機「記住」最近處理的塊的日期指定符,請檢查。
    預設情況下,搜索自動機只處理文本檔案中找到的新命令塊,該命令塊由檔案的日期確定。 如果您不想使用預設值,請勾選 Clear Date ​。
  4. 按一下 Save Changes .
  5. (可選)執行下列任一項作業:

為即時網站設定指令碼式增量索引計畫

您可以安排指令碼式增量索引以在一天中定期執行。
您選取的基本時間會根據「帳戶設定」中設定的時區為本機時間。
Web伺服器通常會安排在半夜停工進行維護。 如果伺服器在計畫的索引時間內關閉,則索引過程將失敗。 請確定您選取了一天中的某個時間,您的Web伺服器才可用。
索引排程僅適用於您的即時索引;不能計劃分段增量索引。
要設定即時網站的指令碼式增量索引計畫
  1. 在產品功能表上,按一下 Index > Scripted Index > Live Schedule ​。
  2. 在頁 Scripted Incremental Index Schedule 面的下拉式清單 Read the Scripted Incrementally Indexing File 中,選取您要執行指令碼增量索引文字檔案的頻率(以小時或分鐘為單位)。
  3. 在下拉 Base Time 式清單中,選取要重新產生新指令碼增量索引的開始時間。
  4. 按一下 Save Changes .

執行即時或分段網站的指令碼增量索引

您可以使用指令碼增量索引來為即時或分段網站的「片段」建立索引,例如經常變更的頁面集合,而不需登入。
要使用此功能,請確定已配置指令碼式增量索引文本檔案。
若要執行即時或分段網站的指令碼增量索引
  1. 在產品功能表上,執行下列其中一項作業:
    • Click Index > Scripted Index > Live Index .
    • Click Index > Scripted Index > Staged Index .
  2. 按一下 Scripted Index Now .
  3. (可選)如果發生索引錯誤,請按一 View Errors 下以檢視相關的記錄檔。

查看即時或分段網站的指令碼式增量索引日誌

當活動完整指令碼索引或分段完整指令碼索引完成時,您可以查看其關聯日誌以排除任何發生的錯誤。
您無法匯出記錄檔,也無法儲存記錄檔。 不過,日誌仍可供查看,直到新索引出現。
若要檢視即時或分段網站的增量索引記錄檔
  1. 在產品功能表上,執行下列其中一項作業:
    • Click Index > Scripted Index > Live Log .
    • Click Index > Scripted Index > Staged Log .
  2. 在記錄頁的上方或下方,執行下列任一作業:
    • 使用導覽選 First ​項、 Prev ​、 Next ​或 Last ​在日誌 Go to line 中移動。
    • 使用顯示選 Errors only ​項 Wrap line ​或 Show 調整您所看到的內容。