Show Menu
화제×

스크립트 색인 정보

스크립트 색인을 사용하면 로그인하지 않고도 증분 색인 옵션을 작성, 업데이트 및 유지 관리할 수 있습니다. 검색 로봇은 서버에 호스팅된 텍스트 파일의 지침을 읽습니다.

스크립트 색인 사용

스크립트 증분 인덱싱 구성 정보

스크립트 색인을 사용하려면 # 페이지에서 서버에 있는 스크립트 파일(일반 텍스트 파일)에 대한 URL을 지정합니다. 예, https://www.mysite.com/indexlist.txt . 사이트가 변경될 때 수동으로 또는 자동으로 텍스트 파일에 명령 블록을 추가할 수 있습니다(뉴스 피드, 주식 시세 표시기 또는 기타 변경된 파일에서 정보가 도달하여 트리거된 스크립트 사용).
스크립트 증분 인덱스가 시작되면 검색 로봇이 텍스트 파일을 읽고 해당 파일에 있는 새 명령을 실행합니다. 기본적으로 검색 로봇은 파일 날짜에 따라 결정되는 새로운 명령만 처리합니다. 스크립트 인덱스를 구성할 Clear Date 때 확인하지 않는 한, 검색 로봇은 가장 최근에 처리된 블록의 날짜 지정자를 "기억"합니다.

스크립트 파일 정보

URL에서 지정하는 스크립트 파일은 서버에 있는 일반 텍스트 파일입니다. 캐리지 리턴, 라인 피드 또는 두 가지 모두를 라인 끝 시퀀스에 사용할 수 있습니다. 빈 행에는 0개 이상의 공백 문자가 포함되고 그 뒤에 줄 끝 시퀀스가 옵니다. 모든 명령은 대/소문자를 구분하지 않습니다.
텍스트 파일은 검색 로봇이 스크립팅된 증분 인덱스를 수행할 때 사용하는 정보를 설명하는 블록으로 구성됩니다.
블록은 날짜별로 정렬되며 가장 오래된 블록은 텍스트 파일의 맨 위에, 가장 최근의 블록은 맨 아래에 있습니다. 각 블록은 단일 행 date-command와 date-specifier 명령으로 시작하고 다음 블록 예제와 같이 빈 줄 구분 문자로 끝납니다(다음 사이에 있는 여러 명령).
HTTP 1.1 스타일을 사용하는 경우 10보다 낮은 모든 서수 날짜에 대해 행간 0이 필요합니다. 예를 들어 11월 6일은 11월 6일이 아니라 11월 6일입니다.
명령
설명
date-command
각 블록의 첫 번째 줄은 두 개의 날짜 명령 중 하나로 시작됩니다.
  • date
    "date" 명령을 사용하여 날짜 지정자가 일, 날짜, 시간 및 시간대로 구성됨을 나타냅니다.
  • 날짜 지정자가 시간(예: 784111777)을 초 단위로 구성함을 나타내려면 초를 사용합니다. 초를 사용할 때는 블록 간 시간(초) 이 증가하는지 확인하십시오.
date-specifier
date-specifier 명령은 일반적으로 블록 정보가 파일에 추가된 도수 날짜 및 시간(date 명령) 또는 epoch 초(초 명령)를 기록합니다. 예:
date Sun, 06 Nov 1994 08:49:37 GMT (HTTP 1.1 style) date Sunday, 06-Nov-94 08:49:37 GMT (HTTP 1.0 style) date Sun Nov 6 08:49:37 1994 (Unix asctime() date style) seconds 784111777 (Unix epoch-seconds style)
HTTP 1.1 스타일을 사용하는 경우 10보다 낮은 모든 서수 날짜에 대해 행간 0이 필요합니다. 예를 들어 11월 6일은 11월 6일이 아니라 11월 6일입니다.
검색 로봇은 가장 최근에 처리된 블록의 날짜-지정자를 "기억"하고 "최신" 정보로 간주되는 정보만 인덱싱합니다. 검색 로봇에 대한 실시간 정보는 중요하지 않습니다. 대신 이전에 처리한 다른 시간과 관련된 시간이 중요합니다.)
예를 들어, 검색 로봇은 10:00p.m의 날짜 지정자가 있는 블록을 읽은 후에는 인덱스 작업이 실행되는 시기와 상관없이 오후 10:00까지 기록하는 블록을 읽지 않습니다. 최악의 경우, 날짜 지정자에 "2004" 대신 연도 "2040"을 잘못 입력할 수 있습니다. 이러한 경우 검색 로봇은 다음 인덱싱 작업 중에 2040 블록을 인덱싱한 다음 다른 정보 블록을 읽지 않습니다(2040년 이후 날짜 한 개가 없는 경우). 이러한 경우 이전에 처리한 모든 블록을 텍스트 파일에서 제거하고 날짜 지우기를 클릭한 다음 라이브로 푸시합니다.
주석 선
"#" 문자로 주석 줄을 시작합니다.
각 주석 줄은 자체 라인이어야 합니다.줄 끝 주석을 입력할 수 없습니다.
주석 줄은 빈 줄로 간주되지 않습니다. 다음 예에서처럼 날짜 또는 초 명령 전이라도 블록의 어느 위치에도 표시될 수 있습니다.
    #Added by Cathy Read after the Y2K seminar     date Mon, 29 Dec 1999 09:32:20 GMT 
action-command
각 텍스트 블록에는 원하는 만큼의 작업 명령이 포함될 수 있습니다. 다음 작업 명령 옵션은 표준 증분 인덱싱을 위한 옵션과 동일합니다.
  • add
    URL과 함께 사용합니다. 검색 로봇은 마지막 인덱싱 작업 이후 변경된 지정된 URL만 인덱싱합니다. 또한 검색 로봇은 지정된 문서 내에 포함된 링크를 따라 이동하며 변경된 문서만 인덱싱합니다.
    URL을 nofollow 또는 noindex 키워드는 다음 예와 같습니다.
    add https://www.mydomain.com/ noindex
  • update
    URL 마스크와 함께 사용합니다. 검색 로봇은 지정된 URL 마스크와 일치하는 모든 문서를 찾아 업데이트합니다.
    URL을 nofollow 또는 noindex 키워드는 다음 예와 같습니다.
    update https://www.mydomain.com/products/
  • include 또는 제외
    URL 마스크와 함께 사용합니다. 검색 로봇은 지정된 마스크 유형에 따라 문서를 검색 및 인덱싱하거나("포함") 무시("제외")합니다.
    예:
    include https://www.mydomain.com/products/household/lightbulbs*.html
    또는
    exclude https://www.mydomain.com/archive/
  • include-date 또는 exclude-date
    URL 마스크와 함께 사용합니다. 검색 로봇은 URL과 문서 날짜를 모두 기준으로 문서를 찾아 인덱스화하거나("포함") 무시합니다. 다음 유형의 마스크를 사용할 수 있습니다.
    • include-days NNN
      검색 로봇은 지정된 URL 마스크와 일치하고 NNN일 이상 오래된 모든 문서를 인덱싱합니다.
      URL 마스크에 키워드를 추가할 수 있습니다 nofollow , noindex , and/or server-date .
    • include-date YYYY-MM-DD
      검색 로봇은 지정된 URL 마스크와 일치하는 모든 문서를 인덱싱하고 YYYY-MM-DD 날짜보다 이전 또는 오래된 모든 문서를 인덱싱합니다. 여기서 "YYYY"는 4자리 연도이고 "MM"은 1자리 또는 2자리 월(1-12)이고 "DD"는 1자리 또는 2자리 일(1-31)입니다.
      URL 마스크에 키워드를 추가할 수 있습니다 nofollow , noindex , and/or server-date .
    • exclude-days NNN
      지정된 URL 마스크와 일치하고 NNN일 이상 오래된 모든 문서의 인덱싱을 비활성화합니다.
      키워드와 함께 URL 마스크를 팔로우할 수 있습니다 server-date .
    • exclude-date YYYY-MM-DD
      지정된 URL 마스크와 일치하고 YYYY-MM-DD 날짜보다 오래되거나 오래된 모든 문서의 인덱싱을 비활성화합니다.
      키워드와 함께 URL 마스크를 팔로우할 수 있습니다 server-date .
  • delete
    URL을 지정합니다. 검색 로봇은 URL 파섹
  • deletemask
    검색 로봇은 지정된 URL 마스크와 일치하는 인덱스에서 문서를 제거합니다.

스크립트 파일 예제

다음 스크립트 파일 예에서 검색 로봇은 date-specifiers가 가장 최근에 처리된 블록의 date-specifier를 post-date로 지정하도록 제공된 블록을 처리합니다. 이러한 경우 다음 인덱싱 작업이 발생합니다.
  • 인덱스에서 y2k-problems.html 삭제합니다.
  • 검색 no-y2k-problems.html 색인에 추가되고 다음에 오는 링크가 no-y2k-problems.html 없습니다.
  • 크롤링 시 검색 인덱스에서 일치하는 URL housewares.htm lightfixtures.htm l을 제외합니다.
  • 다른 모든 디렉토리 및 문서를 www.mydomain.com 아래에 포함합니다.
  • 마지막 인덱싱 작업 이후 변경된 모든 하위 링크를 products 크롤링 및 인덱싱하고, 및 information 디렉토리 내의 모든 문서를 업데이트합니다.
  • 크롤링 시 1999년 1월 1일 또는 그 이전에 갱신된 경우 웹 사이트의 archive 섹션에서 URL을 제외합니다.
  • 검색 인덱스와 일치하는 URL housewares.html lightfixtures.html 제외합니다.
  • 디렉토리에 있는 파일을 help 인덱스화하지만 해당 파일의 링크를 크롤링하거나 색인화하지 마십시오.
  • 에 대해 발생한 다른 모든 파일을 크롤링 및 인덱싱합니다 www.mydomain.com .
# Start of file. 
# Added by John Smith 
date Sat, 01 Jan 2004 16:05:53 PST 
exclude https://www.mydomain.com/housewares.html 
exclude https://www.mydomain.com/lightfixtures.html 
include https://www.mydomain.com/ 
delete https://www.mydomain.com/y2k-problems.html 
add https://www.mydomain.com/no-y2k-problems.html nofollow 
 
date Sun, 02 Jan 2004 20:19:08 PST 
# Added by the wire service updater 
exclude-date 1999-01-01 https://www.mydomain.com/archive server-date 
exclude https://www.mydomain.com/housewares.html 
exclude https://www.mydomain.com/lightfixtures.html 
include https://www.mydomain.com/help/ nofollow 
include https://www.mydomain.com/ 
# no add files, just update existing files 
# update all files in the "products" directory 
update https://www.mydomain.com/products/ 
# update all files in the "information" directory 
update regexp ^https://www\.mydomain\.com/information/.*$ 
# End of file.

스크립트 증분 색인 구성

로그인하지 않고도 증분 인덱스를 작성하고 업데이트하고 유지하는 스크립트를 지정할 수 있습니다. 검색 로봇은 서버에 호스트된 텍스트 파일의 지침을 읽어 증분 인덱스를 수행합니다.
스크립트 증분 인덱스를 구성하려면
  1. 제품 메뉴에서 > Index > Scripted Index > Configuration ​을 클릭합니다.
  2. 페이지의 Scripted Incremental Index Configuration 에서 Script File URL ​서버에 있는 텍스트 파일 스크립트의 URL을 입력합니다.
  3. (선택 사항) 검색 로봇이 가장 최근에 처리된 블록의 날짜-지정자를 "기억"하지 않도록 Clear Date 하려면 선택합니다.
    기본적으로 검색 로봇은 파일의 날짜에 따라 결정되는 텍스트 파일에 있는 새로운 명령 블록만 처리합니다. 기본값을 원하지 않는 경우 선택합니다 Clear Date .
  4. 클릭 Save Changes .
  5. (선택 사항) 다음 중 하나를 수행합니다.
    • 아이콘을 History 클릭하여 변경한 내용을 되돌립니다.
      작업 내역 옵션 사용을 참조하십시오.
    • 클릭 Live .
      라이브 설정 보기를 참조하십시오.
    • 클릭 Push Live .
      스테이지 설정 라이브를 참조하십시오.

라이브 웹 사이트에 대해 스크립팅된 증분 색인 일정 설정

스크립팅된 증분 인덱싱을 하루 종일 정기적으로 실행하도록 예약할 수 있습니다.
선택하는 기본 시간은 계정 설정에 구성된 시간대에 따라 로컬입니다.
계정 설정 구성을 참조하십시오.
웹 서버는 보통 밤 중에 유지 보수를 위해 다운될 예정입니다. 예약된 인덱스 시간 동안 서버가 다운된 경우 색인 프로세스가 실패합니다. 웹 서버를 사용할 수 있는 시간을 선택해야 합니다.
색인 예약은 라이브 색인에만 적용됩니다.단계 증분 색인은 예약할 수 없습니다.
라이브 웹 사이트에 대해 스크립팅된 증분 색인 일정을 설정하려면
  1. 제품 메뉴에서 > Index > Scripted Index > Live Schedule ​을 클릭합니다.
  2. 페이지의 Scripted Incremental Index Schedule Read the Scripted Incrementally Indexing File 드롭다운 목록에서 스크립팅된 증분 인덱스 텍스트 파일을 실행할 빈도를 몇 시간 또는 몇 분 단위로 선택합니다.
  3. 드롭다운 목록에서 새 스크립트 증분 인덱스를 다시 생성할 시작 시간을 선택합니다. Base Time
  4. 클릭 Save Changes .

라이브 또는 스테이지된 웹 사이트의 스크립트 증분 색인 실행

스크립트 증분 색인을 사용하면 로그인하지 않고도 라이브 또는 스테이지된 웹 사이트의 "조각"을 자주 변경되는 페이지 컬렉션과 같이 인덱싱할 수 있습니다.
이 기능을 사용하려면 스크립팅된 증분 색인 텍스트 파일을 구성해야 합니다.
스크립트 증분 색인 구성을 참조하십시오.
라이브 또는 스테이지 웹 사이트의 스크립트 증분 인덱스를 실행하려면
  1. 제품 메뉴에서 다음 중 하나를 수행합니다.
    • 클릭 Index > Scripted Index > Live Index .
    • 클릭 Index > Scripted Index > Staged Index .
  2. 클릭 Scripted Index Now .
  3. (선택 사항) 색인 오류가 발생하면 아이콘을 클릭하여 관련 로그를 View Errors 봅니다.

라이브 또는 스테이지 웹 사이트의 스크립트 증분 인덱스 로그 보기

실시간 전체 스크립트 색인 또는 스테이지된 전체 스크립트 인덱스가 완료되면 연결된 로그를 보고 발생한 오류를 해결할 수 있습니다.
로그를 내보내거나 저장할 수 없습니다. 하지만 새 인덱스가 발생할 때까지 로그를 볼 수 있습니다.
라이브 또는 스테이지 웹 사이트의 증분 인덱스 로그를 보려면
  1. 제품 메뉴에서 다음 중 하나를 수행합니다.
    • 클릭 Index > Scripted Index > Live Log .
    • 클릭 Index > Scripted Index > Staged Log .
  2. 로그 페이지의 맨 위 또는 아래에서 다음 중 하나를 수행합니다.
    • 탐색 옵션 Prev , Last ​또는 Go to line 로그를 통해 이동할 수 있습니다.
    • 표시 옵션을 Errors only ​사용하거나 Wrap line ​표시되는 내용을 Show 수정할 수 있습니다.