Show Menu
화제×

증분 색인 정보

증분 색인을 사용하여 자주 변경되는 페이지의 컬렉션과 같이 라이브 또는 스테이징 웹 사이트의 "조각"을 색인화할 수 있습니다.

증분 색인 사용

증분 색인은 수행하는 데 단 몇 초만 소요되며 완전히 색인화하는 데 많은 시간이 걸릴 수 있는 대용량 웹 사이트에서 유용합니다.
증분 색인을 생성하면 색인 작성 프로세스 동안 시작 시간, 경과 시간 및 오류와 같은 상태 정보가 표시됩니다. 마지막 인덱스의 상태에 대한 정보도 표시됩니다.
언제든지 증분 색인 프로세스를 중지하거나 다시 시작할 수 있습니다.
라이브 웹 사이트에 대한 새로운 증분 색인 빌드에서는 고객이 마지막 증분 색인을 사용하여 사이트를 계속 검색할 수 있습니다.

단계 웹 사이트의 증분 색인 구성

웹 사이트 URL 및 URL 마스크를 지정하여 증분 색인에 포함할 웹 사이트 페이지를 구성할 수 있습니다.
단계 웹 사이트의 증분 색인 구성
  1. 제품 메뉴에서 Index > Incremental Index > 를 Configuration ​클릭합니다.
  2. 페이지에서 Incremental Index Configuration 다양한 필드를 사용하여 색인화할 페이지를 지정합니다.
    필드
    설명
    URL 추가 또는 업데이트
    URL을 지정합니다.
    검색 로봇은 마지막으로 색인화된 이후 변경된 지정된 문서만 인덱싱합니다.
    또한 검색 로봇은 지정된 문서에 포함된 링크를 따르고 변경된 문서만 인덱싱합니다.
    이 필드는 다음 예제와 같이 마스크가 아닌 문서 URL을 포함해야 합니다.
    https://www.mydomain.com/products/new.html
    URL에 다음 키워드를 사용할 수 있습니다.
    • noindex
      지정된 URL과 일치하는 페이지의 텍스트를 색인화하지 않고 페이지의 링크를 따르려는 경우 다음 예에서처럼 URL noindex 뒤에 추가하십시오.
      https://www.mydomain.com/products/new.html noindex
      공백이 있는 URL noindex 과 구분해야 합니다.쉼표는 올바른 구분 기호가 아닙니다.
    • nofollow
      지정된 URL과 일치하는 페이지의 텍스트를 색인화하지만 페이지의 링크를 따르지 않으려면 다음 예에서처럼 URL nofollow 뒤에 추가하십시오.
      https://www.mydomain.com/products/new.html nofollow
      공백이 있는 URL nofollow 과 구분해야 합니다.쉼표는 올바른 구분 기호가 아닙니다.
    URL 마스크 찾기 및 업데이트
    전체 경로, 부분 경로 또는 와일드카드 또는 정규 표현식을 사용하는 경로 등 간단한 URL 마스크를 지정합니다.
    검색 로봇은 모든 일치하는 문서를 검색하고 마지막으로 색인화한 이후 변경된 문서만 인덱싱합니다.
    또한 검색 로봇은 일치하는 문서 내에 포함된 링크를 따라가고 변경된 페이지만 인덱싱합니다. 예:
    https://www.mydomain.com/products/household/*.html
    다음 예제와 같이 정규 표현식을 사용할 수도 있습니다.
    regexp ^https://www\.mydomain\.com/products/household/.*\.html$
    nofollow 의 추가 또는 업데이트 URL에 설명된 대로 키워드 noindex 를 사용할 수도 있습니다.
    URL 마스크 포함 및 제외
    전체 경로, 부분 경로 또는 와일드카드 또는 정규 표현식을 사용하는 경로 등 간단한 URL 포함 또는 제외를 지정할 수 있습니다.
    검색 로봇은 지정된 마스크 유형에 따라 문서를 찾아 인덱싱하거나("include") 문서를 무시합니다.
    사이트를 색인화할 때 나타나는 순서대로 방향이 적용됩니다. 예를 들어 다음 마스크 목록을 참조하십시오.
    include https://www.mydomain.com/products/household/lightbulbs*.html
    exclude https://www.mydomain.com/products/
    페이지 lightbulbs1.html 및 페이지를 인덱싱합니다 lightbulbs2.html . 하지만 products 디렉토리 아래에 나열된 다른 페이지는 인덱싱하지 않습니다.
    먼저 나타나는 URL 마스크가 항상 목록에 나중에 나타나는 마스크보다 우선합니다. 또한 검색 로봇이 포함 마스크와 제외 마스크와 일치하는 문서가 발견되면 먼저 나열된 마스크가 우선합니다.
    nofollow 의 추가 또는 업데이트 URL에 설명된 대로 키워드 noindex 를 사용할 수도 있습니다.
    날짜 마스크 포함 및 제외
    전체 경로, 부분 경로 또는 와일드카드 또는 정규 표현식을 사용하는 패스와 같은 간단한 포함 또는 제외 날짜 마스크를 지정합니다.
    검색 로봇은 URL과 문서 날짜를 모두 기준으로 문서를 찾아 인덱싱하거나("include") 문서를 무시합니다.
    다음과 같은 유형의 날짜 마스크를 사용할 수 있습니다.
    • include-days NNN
      검색 로봇은 지정된 URL 마스크와 일치하고 NNN 일 이상인 모든 문서를 인덱싱합니다.
      다음 키워드 중 하나 이상이 포함된 URL 마스크를 따를 수 있습니다.
      • nofollow
      • 인덱스
      • server-date
      예를 들어 다음 마스크에는 0일 이상의 /archive/support 폴더에 있는 모든 문서가 포함됩니다.
      include-days 0 https://www.mydomain.com/archive/support/
    • include-date YYYY-MM-DD
      검색 로봇은 지정된 URL 마스크와 일치하고 YYYY-MM-DD 날짜보다 이전 또는 오래된 모든 문서를 인덱싱합니다.
      다음 키워드 중 하나 이상이 포함된 URL 마스크를 따를 수 있습니다.
      • nofollow
      • 인덱스
      • server-date
      다음 마스크 예에는 2011년 7월 25일 이전에 발급된 /archive/ 폴더에 있는 모든 문서가 포함됩니다.
      include-date 2011-07-25 https://www.mydomain.com/archive/
    • exclude-days NNN
      지정된 URL 마스크와 일치하고 NNN일 이상이 지난 모든 문서의 인덱싱을 비활성화합니다.
      원할 경우, 키워드를 기준으로 URL 마스크를 따를 수 있습니다 server-date .
      다음 마스크 예제에서는 90일 이상 된 모든 PDF 파일을 색인에서 제외합니다.
      exclude-days 90 *.pdf
    • exclude-date YYYY-MM-DD
      지정된 URL 마스크와 일치하고 YYYY-MM-DD 날짜보다 이전 또는 오래된 모든 문서의 인덱싱을 비활성화합니다.
      원할 경우, 키워드를 기준으로 URL 마스크를 따를 수 있습니다 server-date .
      다음 마스크 예제는 2004년 4월 23일 또는 이전에 발급된 /archive/ 폴더에 있는 모든 문서를 제외합니다.
      exclude-date 2004-04-23 https://www.mydomain.com/archive/
    URL 삭제
    URL을 지정합니다.
    검색 로봇은 검색 색인에서 지정된 문서를 찾아 삭제합니다. 지정한 페이지가 검색 인덱스에 이미 있는 경우 로봇은 다른 페이지를 추가하거나 업데이트하기 전에 페이지를 삭제합니다.
    이 필드에는 마스크가 아닌 문서 URL만 포함되어야 합니다.
    URL 마스크 찾기 및 삭제
    전체 경로, 부분 경로 또는 와일드카드 또는 정규 표현식을 사용하는 단순 URL 마스크를 지정합니다.
    지정된 URL 마스크가 검색 인덱스의 페이지와 일치하는 경우 검색 로봇이 다른 페이지를 추가하거나 업데이트하기 전에 페이지를 삭제합니다. 예:
    https://www.mydomain.com/products/1998/household/*
    다음 예제와 같이 정규 표현식을 사용할 수도 있습니다.
    regexp ^https://www\.mydomain\.com/products/199[567]/.*$
  3. 클릭 Save Changes .
  4. (선택 사항) 다음 중 하나를 수행합니다.

라이브 웹 사이트에 대한 증분 색인 일정 설정

증분 색인 빈도 및 증분 색인을 크롤링 및 업데이트하는 데 사용되는 기본 시간을 선택할 수 있습니다.
선택한 시간은 계정 설정에 구성된 시간대에 따라 로컬입니다.
인터넷 서버는 밤중에 유지 보수를 위해 작동이 안 되는 경우가 많다. 예약된 인덱스 시간 동안 서버가 다운된 경우 색인 프로세스가 실패합니다. 웹 서버를 사용할 수 있는 시간을 선택해야 합니다.
색인 예약은 라이브 색인에만 적용됩니다.스테이지된 색인은 예약할 수 없습니다.
라이브 웹 사이트에 대한 증분 색인 일정을 설정하려면
  1. 제품 메뉴에서 Index > Incremental Index > 를 Live Schedule ​클릭합니다.
  2. 페이지 Incremental Index Schedule Incrementally Index 드롭다운 목록에서 몇 시간 또는 몇 분 단위의 인덱싱 빈도를 선택합니다.
  3. 드롭다운 Base Time 목록에서 새 증분 인덱스를 재생성할 시작 시간을 선택합니다.
  4. 클릭 Save Changes .

라이브 또는 스테이징 웹 사이트의 증분 색인 실행

증분 색인을 사용하여 자주 변경되는 페이지의 컬렉션과 같이 라이브 또는 스테이징 웹 사이트의 "조각"을 색인화할 수 있습니다.
라이브 또는 스테이징 웹 사이트의 증분 인덱스를 실행하려면
  1. 제품 메뉴에서 다음 중 하나를 수행합니다.
    • 클릭 Index > Incremental Index > Live Index .
    • 클릭 Index > Incremental Index > Staged Index .
  2. 클릭 Incremental Index Now .
  3. (선택 사항) 색인 오류가 발생하면 을 클릭하여 관련 로그 View Errors 를 봅니다.

라이브 또는 스테이징 웹 사이트의 증분 색인 로그 보기

실시간 증분 색인 또는 단계 증분 색인이 완료되면 연결된 로그를 보고 발생한 오류를 해결할 수 있습니다.
로그를 내보내거나 저장할 수 없습니다. 로그는 새 인덱스가 발생할 때까지 볼 수 있습니다.
라이브 또는 스테이징 웹 사이트의 증분 색인 로그를 보려면
  1. 제품 메뉴에서 다음 중 하나를 수행합니다.
    • 클릭 Index > Incremental Index > Live Log .
    • 클릭 Index > Incremental Index > Staged Log .
  2. 로그 페이지의 맨 위 또는 아래에서 다음 중 하나를 수행합니다.
    • 탐색 옵션 First , Prev Next , Last ​또는 로그를 Go to line 통해 이동합니다.
    • 표시 옵션 Errors only ​을 Wrap line ​사용하거나 표시되는 내용을 Show 다듬을 수 있습니다.