Show Menu
화제×

FAQ

SWF 파일은 언제 크롤링 및 인덱싱됩니까?

SWF 파일은 다음 예와 같이 HTML 페이지의 포함 또는 개체 태그에 포함되어 있으면 크롤링 및 인덱싱됩니다.
<embed src="Flash-file-URL">  
 
<object>  
<param name=movie value="Flash-file-URL">  
</object> 

SWF 파일은 파일 URL을 진입점으로 나열하는 경우에도 인식됩니다.
색인화할 여러 URL 진입점 추가를 참조하십시오.

SWF 파일을 색인화하려면 어떻게 해야 합니까?

SWF 파일을 크롤링 및 색인화하려면 컨텐츠 유형 Adobe Flash Movies ( Settings > Crawling > Content Types )을 선택합니다.
Flash 파일이 HTML 문서의 <embed> 태그나 <object> 태그에서 참조되는 한, 텍스트는 인덱싱되며 파일에 나열된 모든 URL이 크롤됩니다.
파일이 <embed> 태그나 <object> 태그에서 참조되지 않으면 HTML 문서의 <a href=...> 태그나 URL 진입점으로 SWF 파일을 나열할 수 있습니다.
색인화할 여러 URL 진입점 추가를 참조하십시오.

SWF 파일은 어떻게 인식됩니까?

SWF 파일은 다음 MIME 유형으로 식별됩니다.
application/x-shockwave-flash
파일 확장자가 .swf인 경우 SWF 파일은 application/octet-stream " 또는 text/plain MIME 유형으로도 인식됩니다.
잘못 구성된 서버에서 SWF 파일에 대해 다른 MIME 유형을 사용할 수 있습니다. SWF 파일의 크롤링 및 색인화에 문제가 있는 경우 서버 구성을 확인하십시오.

SWF 파일은 어떻게 인덱싱됩니까?

SWF 파일에 포함된 텍스트는 포함하는 HTML 페이지의 <body> 텍스트인 것처럼 인덱싱됩니다. 검색 결과가 포함된 SWF 파일에 포함된 텍스트를 찾으면 SWF 파일이 아닌 포함하는 HTML 페이지로 연결됩니다. 이렇게 하면 SWF 파일이 올바른 컨텍스트에 표시됩니다.
SWF 파일에 URL이 "동영상 로드" 액션으로 포함되어 있는 경우 참조된 SWF 파일의 텍스트는 포함하는 HTML 페이지의 일부로 인덱싱됩니다.
SWF 파일에 URL이 "URL 가져오기" 동작으로 포함되어 있는 경우 HTML <a href=...> 참조가 나중에 크롤링 및 인덱싱될 때처럼 URL이 나중에 크롤링 및 인덱싱됩니다.
SWF 파일이 URL 진입점으로 나열되는 경우 SWF 파일 텍스트는 단일 페이지로 인덱싱됩니다. 진입점 SWF에서 텍스트를 찾는 검색 결과는 바깥쪽 HTML 페이지가 아니라 동영상에 직접 연결됩니다.
색인화할 여러 URL 진입점 추가를 참조하십시오.

SWF 파일은 페이지로 카운트됩니까?

아니오. SWF 파일은 포함하는 HTML 페이지의 일부로 간주됩니다. SWF 파일에 포함된 모든 "동영상 로드" URL도 포함하는 HTML 페이지의 일부로 간주됩니다. 따라서 HTML 페이지에서 참조되는 SWF 파일은 계정의 페이지 합계에 대해 "페이지"로 계산되지 않습니다.
SWF 파일이 URL 진입점으로 나열되는 경우 해당 SWF 파일과 해당 SWF 파일에 나열된 모든 "동영상 로드" URL은 계정의 페이지 합계에 대해 하나의 "페이지"로 계산됩니다.

개별 SWF 파일의 인덱싱을 방지하려면 어떻게 해야 합니까?

SWF 파일의 인덱싱을 방지하기 위해 로봇 메타 태그( <meta name="ROBOTS" content="NOINDEX"> ) 또는 <noindex> 태그를 포함하는 HTML 문서에 추가할 수 있습니다. 즉, <embed> 또는 <object> 태그를 포함하는 문서입니다.
로봇 메타 태그( <meta name="ROBOTS" content="NOFOLLOW"> )를 사용하여 SWF 파일에 포함된 다음 URL을 방지할 수도 있습니다. 포함하는 HTML 문서에서 다음 기능이 비활성화된 경우 SWF 파일에서 "URL 가져오기" 동작으로 나열된 URL이 적용되지 않습니다.

웹 사이트에서 SWF 파일이 인덱싱되지 않도록 하려면 어떻게 해야 합니까?

SWF 인덱싱을 비활성화하려면 콘텐트 유형을 선택 Adobe Flash Movies 취소합니다( Settings > Crawling > Content Types ).
SWF 파일의 인덱싱을 비활성화하는 URL Masks 데 사용할 수도 있습니다.
SWF 인덱싱을 비활성화하려면 다음 URL 마스크 중 하나를 입력합니다.
  • exclude *.swf (정규 표현식을 사용하지 않는 경우)
  • exclude regexp ^.*\.swf$ (정규 표현식을 사용하는 경우)

웹 사이트에서 중국어, 일본어 또는 한국어 SWF 파일을 검색할 수 없는 이유는 무엇입니까?

사이트 검색/머천다이징은 Adobe Flash로 제작한 SWF 파일에서 UTF-8을 가져옵니다. UTF-8에는 언어가 표시되지 않습니다. 내용 유형을 선택한 Adobe Flash Movies 경우( Settings > Crawling > Content Types ) 메타데이터 주입을 사용하여 SWF 파일에서 사용되는 언어를 지정해야 합니다.
필드 삽입 정의 추가를 참조하십시오.
이전 SWF 파일에서도 문자 집합을 지정하지 않습니다. SWF 내용 유형 Adobe Flash Movies ( Settings > Crawling > Content Types )을 선택한 경우 메타데이터 주입을 사용하여 SWF 파일에 사용되는 문자 세트를 지정해야 합니다.

일반 검색

사이트 검색/머천다이징을 통해 웹 사이트를 방문하는 고객이 원하는 것을 찾는 방법을 설명하는 FAQ 페이지입니다.
일반 검색과 관련된 일반적인 질문은 다음과 같습니다.
다음은 검색 기능에 대한 일반적인 질문입니다.

사이트 검색/머천다이징을 사용하려면 소프트웨어를 설치해야 합니까?

아니오. 이는 사이트 검색/머천다이징의 주요 장점입니다. 엔진은 전문적인 애플리케이션으로 호스팅 및 전적으로 고성능 서버에서 유지 관리됩니다. 따라서 소프트웨어를 다른 검색 솔루션보다 쉽게 사용할 수 있습니다. 단, 웹 사이트 고객이 검색을 입력할 수 있도록 작은 양의 HTML 코드를 페이지에 추가하는 것뿐입니다. 사이트 검색/머천다이징은 나머지 모든 작업을 처리합니다.

내 사이트가 페이지 제한을 초과하면 어떻게 됩니까?

Adobe는 방문자가 중단 없이 웹 사이트를 검색할 수 있도록 검색 서비스를 계속 제공합니다. 웹 사이트가 페이지 제한을 초과하는지 확인하려면 전체 인덱스 상태 또는 라이브 로그를 검토하십시오.

주별 보고서가 전송되는 이메일 주소는 어떻게 변경합니까?

주별 보고서는 각 활성 계정의 소유자에게 전송됩니다. > Settings > My Profile >를 클릭하여 이메일 주소를 변경할 수 Personal Information ​있습니다. 활성 검색 계정이 두 개 이상 있으면 모든 뉴스레터가 새 주소로 전송됩니다.
개인 사용자 정보 구성을 참조하십시오.

사이트 검색/머천다이징에 대한 고객 정보는 얼마나 안전합니까?

사이트 검색/머천다이징은 안전하고 빠르고 안정적이며 사용이 간편합니다. 귀하는 Adobe 제품을 사용하도록 쿠키(원하는 경우)를 강제하지 않으며, 암호 등의 민감한 정보는 나중에 브라우저에서 검색할 수 있는 URL 링크에 절대로 삽입하지 않습니다.

고객 정보의 개인 정보는 어떻게 됩니까?

Adobe는 고객 및 방문자의 개인 정보를 보호하기 위해 최선의 노력을 다하고 있습니다. Adobe 개인정보 보호 센터를 참조하십시오 .

검색 결과 페이지에 고유한 배너 광고를 표시할 수 있습니까?

예. 검색 결과의 모양과 컨텐츠를 제어합니다. 웹 사이트의 검색 결과 템플릿 내에서 LinkExchange 또는 SmartClicks와 같은 자체 배너 교환 네트워크에 대한 링크를 만들 수 있습니다. 방문자가 한 모든 히트는 배너 교환 계정에 대한 크레딧이 됩니다.

사이트에 대한 검색 결과를 사용자 정의할 수 있습니까?

예. 이는 사이트 검색/머천다이징의 전용 기능입니다. 고급 템플릿 기술과 HTML에 대한 간단한 지식을 통해 검색 결과의 표시 방법을 정확하게 제어할 수 있습니다.
템플릿 태그 검색을 참조하십시오.
자체 서버와 사이트 검색/머천다이징 서버 간의 전환이 완벽하고 고객에게 보이지 않습니다. HTML을 모르거나 사용자 정의 템플릿을 만들 시간이 없는 경우 Adobe의 전문 웹 개발자 팀에서 만든 매력적이고 사용하기 쉬운 템플릿을 선택할 수 있습니다.

사이트에서 어떤 고객이 검색하는지 확인할 수 있습니까?

예. 지난 2개월 동안 웹 사이트에서 방문자가 수행한 검색에 대한 검색 통계를 유지합니다. 제품 메뉴의 보고서 아래에서 언제든지 이러한 통계를 검토할 수 있습니다. 검색 보고서는 방문자가 웹 사이트에서 찾고 있는 것과 관련된 중요한 정보를 제공합니다. 이 정보를 사용하여 디자인을 개선하거나 사이트 검색/머천다이징 엔진을 조정하여 방문자에게 보다 나은 서비스를 제공할 수 있습니다.

어떤 컨텐츠 유형(PDF, 텍스트, Flash, MP3 및 Microsoft Office)이 인덱싱되어 검색되는지 어떻게 제어할 수 있습니까?

PDF 문서, 일반 텍스트 문서, Flash 동영상, MP3 파일 또는 Microsoft Office 문서에서 발견되는 텍스트의 인덱싱 및 검색을 활성화하거나 비활성화하도록 계정을 쉽게 구성할 수 있습니다.
이러한 설정은 Staged Content Types 페이지에서 제어됩니다.

ASP, JSP, PHP, CFM 또는 Perl 기반 컨텐츠를 통해 동적으로 생성된 웹 페이지가 지원됩니까?

정적이거나 동적으로 생성된 HTML 웹 페이지는 데이터베이스 또는 다른 백엔드 프로세스를 비롯하여 인덱싱됩니다. 브라우저가 보는 HTML 코드는 인덱스화되므로 이러한 백엔드 아키텍처가 HTML 페이지에 도달하는 한 웹 사이트에서 사이트 검색/머천다이징을 사용할 수 있습니다.
검색 로봇은 에 지정된 웹 사이트 주소의 첫 번째 페이지에서 시작하여 웹 사이트를 탐색하고 Account Settings페이지마다 링크를 따릅니다.
계정 설정 구성을 참조하십시오.
검색 로봇이 웹 사이트의 모든 페이지를 크롤링 및 인덱싱할 때 검색 엔진을 사용하여 사이트를 검색할 수 있습니다. 즉, 동적으로 생성된 문서가 다른 페이지의 링크와 함께 웹 사이트로 결합되는 경우 검색 로봇은 동적 컨텐츠를 크롤링 및 색인화할 수 있습니다.
웹 사이트 컨텐츠가 크롤링 및 인덱스화된 후 웹 사이트로 연결되는 고객은 인덱스화된 컨텐츠 내에서 정보를 검색할 수 있습니다.

동의어를 사용하여 내 사이트의 검색 결과를 개선할 수 있는 방법은 무엇입니까?

방문자가 검색 쿼리와 관련된 페이지를 찾도록 할 때 유의어를 사용할 수 있습니다.
예를 들어 사이트에서 판매할 제품의 가격 목록이 포함된 페이지가 있다고 가정합니다. 그러나 사이트 검색/머천다이징에서 제공하는 검색 보고서를 검토한 후 고객이 검색에서 "비용", "비용", "비용" 또는 "비용"이라는 단어를 찾고 있는 것을 확인할 수 있습니다. 이러한 단어는 검색 결과에 가격 목록 페이지를 표시하지 않습니다. 의 Add Synonyms 기능을 Dictionaries사용하면 이러한 단어가 모두 동의어임을 지정할 수 있으며 고객은 사용하는 검색어에 상관없이 가격 목록을 찾을 수 있습니다.

검색 결과 순서를 제어할 수 있습니까?

예. 고급 관련성 인터페이스를 사용하여 특정 검색 쿼리에 대해 반환되는 페이지를 제어할 수 있습니다. 이 기능은 고객이 특정 단어를 쿼리할 때 특정 페이지를 보도록 하려는 경우 유용합니다.
메타 태그 필드 추가를 참조하십시오.

검색 결과 페이지의 언어를 변경할 수 있습니까?

예. 사이트 검색/머천다이징 템플릿은 원하는 언어를 사용하고 웹 사이트의 모양과 일치하는 결과 페이지를 구성할 때 유연하게 사용할 수 있습니다.
템플릿은 텍스트, 표준 HTML 태그 및 검색 결과를 표시하도록 정의된 특수 태그의 조합으로 구성됩니다. 고객이 검색을 수행하면 검색 로봇은 템플릿을 읽고 표준 HTML 태그를 사용하여 텍스트를 출력하고 특수 템플릿 태그를 기준으로 결과 링크를 삽입합니다.
템플릿 태그 검색을 참조하십시오.
결과 언어를 변경하려면 템플릿에 표시되는 영어 텍스트를 편집할 수 있습니다.
프레젠테이션 또는 전송 템플릿 편집을 참조하십시오.

Adobe 고객 로그인 시 사이트를 두 개 이상 보유할 수 있습니까?

예. 단일 Adobe 고객 로그인을 사용하면 다양한 웹 사이트에 대해 다른 검색 엔진을 관리할 수 있습니다. "계정"에서 계정을 선택하고 관리합니다.
사용할 다른 계정 선택을 참조하십시오.

두 개 이상의 도메인을 검색할 수 있습니까?

예. 를 사용하여 두 개 이상의 도메인에 대한 액세스를 구성할 수 URL Entrypoints있습니다. 소유한 추가 도메인에 대한 URL 진입점을 제공합니다. 소유하지 않은 도메인을 인덱싱할 수 있는 권한이 있어야 합니다.

고객이 이러한 영역을 개별적으로 또는 전체 사이트를 검색할 수 있도록 사이트를 별도의 섹션으로 나눌 수 있습니까?

예. 고객이 웹 사이트의 특정 영역을 빠르게 검색하여 원하는 항목을 신속하게 찾을 수 있도록 해주는 "컬렉션" 기능이 포함되어 있습니다.
예를 들어 고객은 제품 판매 정보와 관련된 URL 컬렉션 또는 지원 서비스와 관련된 URL 컬렉션을 검색할 수 있습니다. 고객이 컬렉션의 드롭다운 목록이나 확인란 그룹을 보도록 컬렉션을 설정할 수 있습니다.

웹 사이트의 일부 부분은 검색되지 않도록 하려면 어떻게 해야 합니까?

예. URL 마스크를 지정하여 색인화에서 포함하거나 제외할 웹 사이트 페이지를 결정합니다. URL 마스크는 웹 사이트 페이지가 검색 결과에 표시되는지 여부를 결정합니다.
URL 마스크 스크립트 정보를 참조하십시오.
개별 웹 페이지의 일부가 검색되지 않도록 하려면 페이지의 일부를 인덱스에서 제외할 수 있습니다. 텍스트를 <noindex> </noindex> 태그로 둘러싸십시오. 이 방법은 검색에서 탐색 텍스트를 제외하려는 경우에 유용합니다.

지원되는 문자 집합은 무엇입니까?

웹 페이지는 일반적으로 다음과 유사한 메타 태그를 사용하여 문자 집합을 지정합니다.
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
사이트 검색/머천다이징 엔진은 오늘날 인터넷에서 사용 중인 모든 일반적인 문자 집합을 사용하여 웹 페이지를 적절하게 인덱싱합니다. 지원되는 문자 집합 중 일부는 다음과 같습니다.
아랍어(ISO-8859-6)
중국어(번체)Big5)
일본어(Shift_JIS 파섹)
아랍어(Windows-1256)
중국어(번체)EUC-TW)
러시아어(KOI8-R)
발트어(ISO-8859-4)
키릴 자모(ISO-8859-5)
남부 유럽(ISO-8859-3)
발트어(Windows-1257)
키릴 자모(Windows-1251)
터키어(ISO-8859-9)
중부 유럽(ISO-8859-2)
그리스어(ISO-8859-7)
터키어(Windows-1254)
중부 유럽(Windows-1250)
그리스어(Windows-1253)
유니코드(UTF-8)
중국어(ISO-2022-CN)
히브리어(ISO-8859-8)
US-ASCII(us-ascii)
중국어(ISO-2022-CN-EXT)
히브리어(Windows-1255)
서유럽어(ISO-8859-1)
중국어(간체;EUC-CN)
일본어(EUC-JP)
서유럽어(ISO-8859-15)
중국어(간체;GB2312)
일본어(ISO-2022-JP)
서유럽어(Windows-1252)
중국어(간체;GBK)
일본어(ISO-2022-JP-1)
서유럽어(x-mac-roman)
중국어(간체;HZ-GB-2312)
일본어(ISO-2022-JP-2)
기술 지원에 문의하여 위에 나열되지 않은 문자 집합에 대해 질문하십시오.

웹 사이트를 변경하거나 업데이트하면 어떻게 됩니까?

웹 사이트의 컨텐츠를 변경한 후 전체 색인이나 증분 색인을 수행할 수 있습니다. 사이트 검색/머천다이징 다운로드 및 변경된 웹 사이트 컨텐츠 색인화 색인화가 완료되면 고객은 새로운 컨텐츠를 검색할 수 있습니다. 특정 시간과 특정 날짜에 사이트의 자동 색인 지정 일정을 예약할 수도 있습니다.
라이브 웹 사이트에 대한 전체 인덱스 일정 설정을 참조하십시오.
라이브 웹 사이트에 대한 증분 인덱스 일정 설정을 참조하십시오.

사이트를 자동으로 색인화할 수 있습니까?

예. 매일 사이트의 자동 색인을 예약할 수 있습니다.
매일 자동 색인 작성 외에도 사이트의 일부를 점진적으로 색인화하도록 선택할 수 있습니다. 자동 색인이 예약되어 있는 날에는 색인이 발생하는 시간을 제어할 수 있습니다. 또한 언제든지 수동으로 사이트 인덱스를 시작할 수 있습니다.
라이브 웹 사이트에 대한 전체 인덱스 일정 설정을 참조하십시오.
라이브 웹 사이트에 대한 증분 인덱스 일정 설정을 참조하십시오.

나는 내 웹사이트에서 암호를 사용한다. 사이트 검색/머천다이징을 계속 사용할 수 있습니까?

HTTP 기본 인증을 사용하여 웹 사이트의 특정 부분을 암호로 보호하는 경우 사이트 검색/머천다이징에 사용할 영역 및 암호를 지정할 수 있습니다.

https 또는 보안 서버 컨텐츠의 크롤링 및 인덱싱 기능을 지원합니까?

예. 보안 서버(https)에서 컨텐츠를 크롤링 및 인덱싱할 수 있습니다.

사이트 검색/머천다이징은 내 웹 사이트의 robots.txt 파일을 승인합니까?

예. Robots Exclusion Protocol은 준수합니다. 검색 로봇은 robots.txt 파일이 웹 사이트에 있을 경우 이를 검사합니다. robots.txt 파일에서 모든 로봇을 사이트 크롤링 시 제외하는 경우 사이트 검색/머천다이징 로봇도 제외됩니다. 사이트 검색/머천다이징 로봇만 사이트를 탐색하도록 하려면 robots.txt 파일의 내용을 다음과 같이 설정합니다.
User-agent: Atomz/1.0 
Disallow:

User-agent: * 
Disallow: /

웹 로봇과 로봇 제외 프로토콜에 대한 자세한 내용은 다음 링크를 참조하십시오.

고객이 가장 정확한 검색 결과를 얻을 수 있도록 웹 사이트의 특정 부분을 자주 업데이트해야 합니다. 증분 인덱싱을 통해 이 문제가 해결됩니까?

예. 이 시나리오는 사이트 검색/머천다이징을 용이하게 하기 위해 작성된 증분 인덱싱 기능입니다. 증분 인덱싱을 통해 회사가 웹 사이트의 일부를 동적으로 색인화할 수 있다는 이점이 있습니다. 이러한 기능을 사용하면 "최대 분" 정확도로 검색 결과를 표시할 수 있습니다.
라이브 웹 사이트에 대한 증분 인덱스 일정 설정을 참조하십시오.

제품 카탈로그 또는 인벤토리 관리 시스템과 같은 백엔드 데이터베이스에서 동적으로 생성된 웹 페이지가 지원됩니까?

데이터베이스에서 작성된 페이지 또는 다른 백엔드 프로세스를 비롯한 정적 또는 동적으로 생성된 HTML 웹 페이지는 인덱싱됩니다. 브라우저가 보는 HTML 코드는 색인화되어 있으므로, 백 엔드 데이터베이스 정보가 HTML 페이지에 표시되는 한 웹 사이트에서 사이트 검색/머천다이징을 사용할 수 있습니다.
검색 로봇은 에 지정된 웹 사이트 주소의 첫 번째 페이지에서 시작하여 웹 사이트를 탐색하고 Account Settings페이지마다 링크를 따릅니다.
계정 설정 구성을 참조하십시오.
검색 로봇이 웹 사이트의 모든 페이지를 크롤링 및 인덱싱할 때 검색 엔진을 사용하여 사이트를 검색할 수 있습니다. 즉, 동적으로 생성된 문서가 다른 페이지의 링크와 함께 웹 사이트로 결합되어 있는 경우 검색 로봇이 동적 데이터베이스 컨텐츠를 크롤링 및 색인화할 수 있습니다.
웹 사이트 컨텐츠가 크롤링 및 인덱스화된 후 웹 사이트로 연결되는 고객은 인덱스화된 컨텐츠 내에서 정보를 검색할 수 있습니다.
전체 컨텐츠 검색을 쉽게 활성화하거나 제목, 메타 설명, 메타 키워드 문서 태그 또는 세 가지 모두로 제한된 주제 기반 검색을 사용할 수 있습니다. 메타데이터 정의를 사용하여 실제 검색 결과에 제품 이미지와 같은 사용자 정의 표시 필드를 만들 수도 있습니다.
메타 태그 필드 추가를 참조하십시오.

스크립트나 프로그램을 사용하여 사이트의 증분 인덱스를 시작할 수 있습니까?

예. 스크립트나 프로그램을 사용하여 웹 사이트의 증분 색인을 시작할 수 있을 뿐만 아니라 컨텐츠가 변경되거나 업데이트될 때마다 서버에 ping하여 사이트를 인덱싱할 수 있습니다.

기능 구현

의 다양한 기능 구현에 대해 설명하는 FAQ 페이지입니다 Search&Promote.
다음은 웹 사이트의 기능 구현과 관련된 일반적인 Search&Promote 질문입니다.

비즈니스 규칙이 실행되지 않는 이유는 무엇입니까?

배너가 표시될 때 비즈니스 규칙을 구성하거나 결과가 표시되는 내용과 순서를 결정하는 데 도움이 됩니다. 패싯에서 항목의 위치와 지정된 검색에 사용되는 템플릿을 구성할 수도 있습니다. 비즈니스 규칙의 순서를 변경하여 프레젠테이션 템플릿에서 실행하는 순서를 변경할 수 있습니다. 비즈니스 규칙은 정의된 순서대로 실행됩니다.즉, 규칙의 주문 번호가 높을수록 나중에 프로세스에서 실행되어 이전 규칙보다 우선합니다. # 페이지의 테이블의 # 열에 새 번호를 입력하여 규칙 순서를 변경합니다.

색인 예약, 색인 시작 오류, 스테이지된 색인 시작 문제가 발생하는 이유는 무엇입니까?

인덱스를 생성할 때 전체 또는 증분 색인이든 인덱스 크롤링 상태 정보가 실시간으로 표시됩니다. 예를 들어, 시작 시간, 경과 시간 및 색인 작성 프로세스 중에 발생한 모든 오류를 볼 수 있습니다. 마지막 인덱스의 상태에 대한 정보도 표시됩니다. 이 정보를 사용하여 발생하는 색인 오류를 해결하십시오.
인덱스를 예약하려면 라이브 웹 사이트에 대한 전체 인덱스 일정 설정 및 실시간 웹 사이트에 대한 증분 인덱스 예약 설정을 참조하십시오.

색인 크기 제한이 허용된 경계를 초과합니다. 이 문제는 왜 발생하며 어떻게 수정합니까?

웹 사이트는 시간이 지남에 따라 확장되는 경향이 있으며 Search&Promote는 추가된 더 많은 문서와 웹 페이지를 "검색"합니다. 결국 귀하의 계정이 인덱싱 크기 제한을 초과할 수 있습니다. 이러한 경우 사용을 고려할 수 URL Mask ​있습니다. 이 기능은 색인을 원하지 않거나 색인이 필요하지 않은 색인 크롤링(crawing)에서 문서 및 웹 페이지를 숨겨 색인 크기를 줄입니다. 색인 크기 제한이 계정에서 더 크게 설정되도록 하려면 기술 지원에 문의하는 방법도 있습니다.
어떻게 해야 할지 잘 모르는 경우 기술 지원에 문의해야 합니다. 색인 크기에 영향을 주는 다른 변수가 많이 있을 수 있으며, 조정되면 계정 과금에 영향을 줄 수 있습니다.

검색 쿼리의 문자 집합 인코딩을 제어하는 것은 무엇입니까?

검색 계정의 "웹 양식" 섹션에는 검색 기능을 웹 사이트에 추가하는 데 사용하는 샘플 검색 양식이 포함되어 있습니다. 이 검색 양식 코드를 보면 다음과 유사한 라인을 찾을 수 있습니다.
<input type=hidden name="sp_f" value="iso-8859-1">
이 코드 행은 들어오는 쿼리가 서유럽 언어에 대한 일반적인 인코딩인 iso-8859-1로 인코딩되었음을 검색 엔진에 알립니다. 제품 메뉴로 이동한 다음 Settings > My Profile > Personal Information ​을 클릭하여 이 설정을 변경할 수 있습니다. 페이지의 Personal Information Character Encoding 드롭다운 목록에서 새 인코딩을 선택합니다.
개인 사용자 정보 구성을 참조하십시오.
검색 양식의 sp_f 줄을 편집하여 웹 페이지의 인코딩 값을 수동으로 변경할 수도 있습니다. 검색 양식의 sp_f 값은 표시되는 페이지의 문자 집합 인코딩과 일치해야 합니다.

검색 쿼리의 인코딩과 일치하는 인코딩의 페이지만 검색됩니까?

기본적으로 아니요. 웹 사이트 페이지가 문자 집합 인코딩을 올바르게 식별하는 한, 페이지가 여러 인코딩을 사용하는 경우에도 검색 쿼리의 인코딩과 페이지의 인코딩 간에 필요한 전환이 이루어집니다.

검색 결과 페이지에 사용되는 인코딩은 무엇입니까?

계정의 문자 집합 인코딩은 결과 템플릿의 기본 인코딩을 결정합니다.
개인 사용자 정보 구성을 참조하십시오.
HTML 템플릿에서 문자 집합 지정에 대해 자세히 알아볼 수 있습니다.
템플릿 태그 검색을 참조하십시오.

유니코드, UTF-8, 인코딩 페이지에서 사이트 검색/머천다이징을 사용할 수 있습니까?

예. 그러나 UTF-8과 같은 유니코드 문자 집합은 페이지가 작성되는 언어를 결정하는 데 필요한 정보를 충분히 제공하지 않습니다. 이러한 페이지를 올바로 검색하려면 언어를 지정해야 합니다. 문서 언어를 결정하기 위해 정보는 다음 순서로 처리됩니다.
  • 서버에 의해 문서에 대한 컨텐츠 언어 HTTP 헤더가 제공됩니다.
  • 문서의 META HTTP-EQUIV="Content-Language" Content="ja_JP"``<HEAD> 섹션에 있는 META 요소(예:
  • 태그의 LANG 속성(예: <HTML> <HTML LANG="ja_JP"> ).
서버가 Content-Language HTTP 헤더를 전달하도록 구성되어 있지 않고 문서에 언어 META 요소나 <HTML> 태그의 언어 속성이 포함되어 있지 않은 경우 메타데이터 주입을 사용하여 적절한 언어를 지정할 수 있습니다.
필드 삽입 정의 추가를 참조하십시오.

웹 사이트에서 중국어, 일본어 또는 한국어 PDF 파일을 검색할 수 없는 이유는 무엇입니까?

사이트 검색/머천다이징은 Adobe PDF 파일에서 언어를 표시하지 않고 UTF-8을 가져옵니다. 선택 PDF Documents ( Settings > Crawling > Content Types )한 경우 메타데이터 주입을 사용하여 PDF 파일에 사용되는 언어를 지정해야 합니다.
필드 삽입 정의 추가를 참조하십시오.

웹 사이트에서 중국어, 일본어 또는 한국어 SWF 파일을 검색할 수 없는 이유는 무엇입니까?

사이트 검색/머천다이징은 Adobe Flash로 만든 Adobe Flash 동영상 파일에서 언어 표시 없이 UTF-8을 가져옵니다. 내용 유형을 선택한 Adobe Flash Movies 경우( Settings > Crawling > Content Types ) 메타데이터 주입을 사용하여 SWF 파일에 사용되는 언어를 지정해야 합니다.
Flash 버전 4 또는 이전 버전의 SWF 파일의 경우 파일에 있는 문자 집합이 지정되지 않습니다. 내용 유형을 선택한 Adobe Flash Movies 경우( Settings > Crawling > Content Types ) 메타데이터 주입을 사용하여 SWF 파일에 사용되는 문자 집합을 지정해야 합니다.
필드 삽입 정의 추가를 참조하십시오.

웹 사이트에서 중국어, 일본어 또는 한국어 Microsoft Office 파일을 검색할 수 없는 이유는 무엇입니까?

사이트 검색/머천다이징은 Microsoft Office 파일(Microsoft Word, Microsoft Excel 및 Microsoft PowerPoint)에서 언어를 표시하지 않고 UTF-8을 가져옵니다. 콘텐트 유형을 선택한 Microsoft Office Files 경우( Settings > Crawling > Content Types ) 메타데이터 주입을 사용하여 Microsoft Office 파일에서 사용되는 언어를 지정해야 합니다.
필드 삽입 정의 추가를 참조하십시오.

웹 사이트에서 중국어, 일본어 또는 한국어 MP3 파일을 검색할 수 없는 이유는 무엇입니까?

컨텐츠 유형 Text in MP3 Music Files ( Settings > Crawling > Content Types )을 선택하는 경우 메타데이터 주입을 사용하여 MP3 파일을 인코딩하는 데 사용되는 문자 세트를 지정해야 합니다.
필드 삽입 정의 추가를 참조하십시오.

웹 사이트에서 .txt 파일을 올바로 인덱싱하려면 특별한 작업이 필요합니까?

컨텐츠 유형을 선택한 Text Documents 경우( Settings > Crawling > Content Types ) 메타데이터 주입을 사용하여 .txt 파일을 인코딩하는 데 사용되는 문자 세트를 지정해야 합니다.
필드 삽입 정의 추가를 참조하십시오.

Netscape 4.7 및 이전 버전에서 중국어, 일본어 또는 한국어 글꼴은 어떻게 검색 결과에 표시됩니까?

계정에서 기본 템플릿, 바로 사용할 수 있는 템플릿 중 하나 또는 이러한 템플릿을 기반으로 하는 템플릿을 사용하는 경우 Arial 또는 Helvetica를 글꼴 면으로 지정하는 글꼴 태그가 포함될 수 있습니다. 예, <font face="arial, helvetica" size="+1"> . Netscape 4.7 이전 버전은 Arial 또는 Helvetica 글꼴 얼굴이 사용되는 경우 중국어, 일본어 또는 한국어 문자를 표시하지 않습니다. 속성을 face 제거하거나 글꼴 얼굴을 중국어, 일본어 또는 한국어에 보다 적합한 글꼴로 바꿉니다.

색인 로그를 검토했습니까?

색인 로그에는 사이트 검색/머천다이징 로봇이 웹 사이트를 색인화할 때 수집하는 자세한 정보가 포함되어 있습니다. 로그에는 크롤링된 링크 및 발생한 오류 목록이 포함되어 있습니다. 색인 로그를 검사하면 웹 사이트의 모든 페이지가 인덱스되지 않는 이유를 확인할 수 있습니다.

URL에 타이핑 오류가 있습니까?

HTML 양식에 긴 URL을 입력하면 하나 이상의 타이포그래피 오류가 발생할 수 있습니다. URL에는 공백이 없어야 합니다. 또한 일부 웹 서버에서는 대소문자를 구분하는 방식으로 URL을 처리합니다.
제품 메뉴에서 > Settings > Crawling > URL Entrypoints ​을 클릭합니다. 페이지에서 Staged URL Entrypoints 다음을 확인합니다.
  • URL에 인쇄 오류가 없습니다.
  • URL의 문자는 모두 대소문자를 구분합니다.
  • URL에 공백 문자가 없습니다.
URL 시작 지점을 테스트하려면 웹 브라우저에 URL을 복사하여 붙여 넣어 웹 사이트가 표시되는지 확인합니다. 나타나지 않는 경우 다시 확인하여 URL 경로에 오류가 없는지 확인합니다.

시작 지점 웹 페이지에 웹 사이트의 다른 페이지에 대한 링크가 있습니까?

사이트 검색/머천다이징 로봇은 고객처럼 웹 사이트를 탐색합니다.페이지 간 링크를 팔로우합니다. 검색 로봇이 사이트에서 다른 페이지를 찾아 색인화하려면 먼저 시작 지점 웹 페이지에 링크가 있어야 합니다.
색인화할 여러 URL 진입점 추가를 참조하십시오.

웹 사이트의 다른 페이지에 대한 링크가 JavaScript에 포함되어 있습니까?

웹 사이트에서 JavaScript를 사용하여 다른 페이지에 연결하는 롤오버 작업 및 메뉴와 같은 정교한 탐색 기법을 사용할 수 있습니다. 그러나 사이트 검색/머천다이징 로봇은 JavaScript에 포함된 링크를 따라갈 수 없습니다.
이 문제를 해결하는 데 사용할 수 있는 한 가지 솔루션은 JavaScript가 포함된 HTML의 다른 페이지에 대한 숨겨진 링크를 배치하는 것입니다. 웹 사이트 고객은 이러한 링크를 볼 수 없지만 검색 로봇은 여전히 링크를 찾아 크롤합니다. 태그 바로 앞에 숨겨진 태그를 페이지 하단에 배치할 수 </body> 있습니다. 다음과 같이 표시될 수 있습니다.
<a href="/mydir/mypag1.html"></a> 
<a href="/mydir/mypag2.html"></a>

또 다른 해결 방법은 웹 사이트에 있는 추가 페이지의 URL을 크롤링 및 색인을 위한 시작 지점으로 나열하는 것입니다. 다음과 https:// 같이 URL을 시작합니다.
https://www.mydomain.com/mydir/mypag1.html 
https://www.mydomain.com/mydir/mypag2.html

색인화할 여러 URL 진입점 추가를 참조하십시오.

웹 페이지의 HTML 태그가 잘못된 시퀀스에 있습니까?

HTML 사양을 사용하려면 HTML 문서의 <html> 특정 시퀀스를 <head> 따라 <body> 태그및 태그가 있어야 합니다. 모든 웹 페이지의 태그에는 다음 시퀀스가 있어야 합니다.
<html> 
<head> 
...  
<i>head tags go here</i> ... 
</head> 
<body> 
...  
<i>body tags go here</i> ... 
</body> 
</html>

HTML 태그가 올바른 순서로 없는 경우 사이트 검색/머천다이징 로봇이 웹 페이지를 제대로 구문 분석하고 색인화할 수 없습니다. 다음은 올바른 시퀀스에 없는 태그의 예입니다.
<body> 
<head> 
...  
<i>head tags are here</i> ... 
</head> 
...  
<i>body tags are here</i> ... 
</body>

이러한 경우 웹 페이지의 올바른 시퀀스에 <html> 태그, <head> <body> 태그를 배치합니다.

웹 페이지에서 HTML 주석 태그를 잘못 구성했습니까?

웹 페이지에서 잘못된 HTML 주석을 주의 깊게 검토하고 수정해야 합니다.
HTML 사양을 사용하려면 HTML 주석이 문자로 <!-- 시작하고 문자로 끝나야 --> 합니다. 사이트 검색/머천다이징 로봇이 웹 페이지의 태그를 부적절하게 구문 분석하도록 하는 잘못된 형식의 주석을 쉽게 간과할 수 있습니다. 잘못 구성된 주석을 사용하면 사이트 검색/머천다이징 로봇이 구문 분석해야 하는 다른 중요한 태그를 놓칠 수 있습니다. 웹 페이지의 <body> 태그 바로 앞에 주석이 있는지 확인합니다.
다음은 적절한 형식의 댓글의 예입니다.
<!-- This HTML comment is OK. -->
다음은 부적절한 형식의 댓글의 예입니다.
<!- This HTML comment is improperly formed. -> 
<! This HTML comment is also improperly formed. >

웹 페이지에 다른 도메인의 페이지에 대한 링크가 포함되어 있습니까?

웹 사이트는 도메인 주소가 다른 웹 서버에 실제로 존재하는 페이지로 구성될 수 있습니다. 예를 들어 기본 웹 사이트 주소가 다음과 같은 경우
https://www.mydomain.com/
웹 사이트에는 다음과 같은 다른 도메인에 페이지가 있을 수도 있습니다.
https://www.otherdomain.com/
기본적으로 사이트 검색/머천다이징 로봇은 기본 도메인이 아닌 다른 도메인의 링크를 따르지 않습니다. 그러나 검색 계정에 대한 추가 진입점을 설정하여 여러 도메인을 쉽게 색인화할 수 있습니다.
제품 메뉴에서 > Settings > Crawling > URL Entrypoints ​을 클릭합니다. 사이트의 "기본 웹 사이트 시작 지점" URL을 추가합니다. 그런 다음 사이트 페이지를 포함하는 다른 모든 도메인에 URL 진입점을 추가합니다. 예를 들어 기본 URL 진입점을 다음과 같이 설정합니다.
https://www.mydomain.com/
및 다음과 같은 추가 사이트 URL 진입점을 추가합니다.
https://www.otherdomain.com/

URL에 가상 도메인 서비스를 사용하고 있습니까?

가상 도메인 서비스("도메인 리디렉션 서비스"라고도 함)를 사용하여 고객이 웹 사이트로 이동할 수 있도록 더 나은 URL을 제공할 수 있습니다. 예를 들어 웹 사이트의 실제 주소가 다음과 같다고 가정합니다.
https://www.myispdomain.com/~myname/mywebpages/
그러나 가상 도메인 서비스를 사용하면 고객이 다음 주소로 사이트에 도달할 수 있습니다.
https://myname.adomain.com/
또는
https://adomain.com/myname/
기본적으로 사이트 검색/머천다이징 로봇은 기본 도메인이 아닌 다른 도메인의 링크를 따르지 않습니다. 그러나 검색 계정에 대한 추가 진입점을 설정하여 여러 도메인을 쉽게 색인화할 수 있습니다.
제품 메뉴에서 > Settings > Crawling > URL Entrypoints ​을 클릭합니다. 사이트의 가상 도메인 이름에 "기본 웹 사이트 URL 시작 지점"을 추가합니다. 그런 다음 웹 사이트가 실제로 존재하는 도메인에 추가 진입점을 추가합니다.
예를 들어 기본 URL 진입점을 다음과 같이 설정합니다.
https://myname.adomain.com/
그리고 다음 추가 웹 사이트 URL 시작 지점을 추가합니다.
https://www.myispdomain.com/~myname/mywebpages/

웹 페이지에서 메타 새로 고침 태그를 사용합니까?

대부분의 웹 사이트에는 다음과 유사한 <head>...</head> 태그 사이에 메타 새로 고침 태그가 포함된 전면 페이지가 있습니다.
<meta http-equiv="Refresh" content="0;URL=https://www.adomain.com/apath/afile.html">
특정 상황에서 사이트 검색/머천다이징 로봇은 메타 새로 고침 URL을 따라 웹 사이트의 컨텐츠를 색인화할 수 없습니다. 이 문제는 추가적인 시작 지점을 설정하여 쉽게 해결할 수 있습니다.
제품 메뉴에서 > 크롤링 Settings > URL Entrypoints ​을 클릭합니다. 메타 새로 고침 태그의 URL에 다른 진입점을 추가합니다.

웹 페이지에서 메타 로봇 태그를 사용합니까?

경우에 따라 웹 페이지는 메타 로봇 태그를 사용하여 웹 사이트를 탐색하는 웹 로봇을 제어합니다. 메타 로봇은 웹 페이지의 <head>...</head> 태그 사이에 나타나며 다음 태그와 비슷합니다.
<meta name="robots" content="noindex, nofollow">
사이트 검색/머천다이징 로봇은 자체 웹 로봇이기 때문에 메타 로봇 태그의 방향을 따릅니다. 이렇게 다른 로봇을 제외함으로써 사이트 검색/머천다이징 로봇도 제외합니다.
웹 로봇과 로봇 제외 프로토콜에 대한 자세한 내용은 다음 링크를 참조하십시오.
웹 사이트에서 인덱싱할 웹 페이지에서 메타 로봇 태그를 제거하거나 수정합니다.

웹 사이트에서 로봇 제외 파일을 사용합니까?

경우에 따라 웹 사이트에는 모든 또는 특정 로봇이 크롤링 작업을 할 수 없도록 제외하는 robots.txt라는 페이지가 있습니다. 웹 사이트에 robots.txt 파일이 있는지 확인하려면 다음과 같이 최상위 도메인 아래에서 확인하십시오.
https://www.yourdomain.com/robots.txt
robots.txt 파일의 내용은 다음 텍스트와 유사합니다.
User-agent: * 
Disallow: /

사이트 검색/머천다이징 로봇은 자체 웹 로봇이므로 robots.txt 파일에서 지침을 따릅니다. 사이트 검색/머천다이징 로봇은 제외됩니다. 이 문제를 해결하려면 로봇 제외 파일(robots.txt)을 편집하여 사이트 검색/머천다이징 로봇이 다음과 같이 웹 사이트를 크롤링 및 색인화할 수 있도록 허용하십시오.
User-agent: Atomz/1.0 
Disallow: 
 
User-agent: * 
Disallow: /

Microsoft Office

웹 사이트에서 Microsoft® Office 파일의 인덱싱 및 검색 지원에 대해 설명하는 FAQ 페이지입니다.
다음은 Microsoft Office 파일에 대한 일반적인 질문입니다.

Microsoft Office 파일에서 색인화된 항목은 무엇입니까?

Microsoft Word 파일, Microsoft Excel 파일 및 Microsoft PowerPoint 파일의 전체 내용은 인덱싱됩니다.
Microsoft Word 파일의 다음 부분은 인덱싱됩니다.
  • Title
  • 키워드
  • 제목(설명)
  • 텍스트 기반 컨텐츠
  • 다른 문서에 대한 하이퍼링크
Microsoft Excel 파일의 다음 부분은 인덱싱됩니다.
  • Title
  • 키워드
  • 제목(설명)
  • 셀의 텍스트
  • 셀의 숫자 수식의 값
Microsoft PowerPoint 파일의 다음 부분은 인덱싱됩니다.
  • Title
  • 키워드
  • 제목(설명)
  • 각 슬라이드의 텍스트

Microsoft Office 파일에서 색인화되지 않은 것은 무엇입니까?

Microsoft Office 파일에 포함되어 있는 그래픽이나 포함된 그래픽의 일부인 텍스트는 색인이 되어 있지 않습니다. 사용자 지정 속성 정의는 메타데이터로 인덱스되지 않습니다. PowerPoint 파일의 머리글과 바닥글과 같은 특수 필드의 일부 텍스트도 색인이 되지 않습니다.

Microsoft Office 파일은 HTML 페이지와 어떻게 다르게 인덱싱됩니까?

검색 로봇이 Microsoft Office 파일과 HTML 파일을 인덱싱하는 방식은 각 HTML 파일이 개별 페이지이고 단일 Microsoft Office 파일은 수백 개의 페이지를 나타낼 수 있다는 점입니다. 따라서 각 페이지는 Microsoft Office 파일 내에서 검색 계정 아래에 별도의 페이지로 카운트됩니다.

웹 사이트에서 Microsoft Office 파일이 인덱싱되지 않도록 하려면 어떻게 해야 합니까?

검색 로봇이 Microsoft Office 파일을 크롤링 및 색인화하지 않도록 하려면 내용 유형 Microsoft Office Files ( Settings > Crawling > Content Types )을 선택 해제합니다.
를 사용하여 Microsoft Office URL Masks 파일의 인덱싱을 비활성화할 수도 있습니다.
다음 URL 마스크를 입력합니다.
정규 표현식을 사용하지 않는 경우
  • exclude *.doc
  • exclude *.xls
  • 제외 *.ppt
정규 표현식을 사용하는 경우
  • regexp ^를 제외합니다.*\.doc$
  • regexp ^를 제외합니다.*\.xls$
  • regexp ^를 제외합니다.*\.ppt$

MP3 파일은 언제 크롤링 및 인덱싱됩니까?

MP3 파일은 두 가지 방법 중 하나로 크롤링 및 색인화됩니다. 가장 일반적인 방법은 HTML 파일의 앵커 href 태그에서 온 것입니다.
<a href="MP3-file-URL"></a>
두 번째 방법은 MP3 파일의 URL을 URL 진입점으로 입력하는 것입니다.

사이트에서 MP3 파일을 크롤링 및 색인화하려면 어떻게 해야 합니까?

계정에 대한 MP3 크롤링 및 인덱싱을 활성화하려면 제품 메뉴에서 Settings > Crawling > Content Types ​을 클릭합니다. 페이지에서 Staged Content Types 을 선택합니다 Text in MP3 Music Files .

MP3 파일은 어떻게 인식됩니까?

MP3 파일은 "audio/mpeg"인 MIME 유형으로 인식됩니다.

MP3 파일에서 색인화된 것은 무엇입니까?

MP3 파일은 선택적으로 소량의 텍스트 정보를 저장합니다. 이 정보에는 앨범 이름, 아티스트 이름, 노래 제목, 노래 장르, 릴리스 연도 및 댓글이 포함될 수 있습니다. 이 정보는 파일의 맨 끝에 TAG라는 이름으로 저장됩니다. TAG 정보가 들어 있는 MP3 파일은 다음 방법으로 인덱싱됩니다.
  • 노래 제목은 HTML 페이지의 제목처럼 처리됩니다.
  • 주석은 HTML 페이지에 대해 정의된 설명처럼 처리됩니다.
  • 장르는 HTML 페이지에 대해 정의된 키워드로 처리됩니다.
  • 아티스트 이름, 앨범 이름 및 릴리스 연도는 HTML 문서의 본문처럼 처리됩니다.

MP3 파일은 페이지로 계산됩니까?

예. 웹 사이트에서 크롤링 및 인덱싱된 각 MP3 파일은 하나의 페이지로 계산됩니다.

개별 MP3 파일의 인덱싱을 방지하려면 어떻게 해야 합니까?

MP3 파일에 연결된 앵커 태그를 <nofollow> </nofollow> 태그로 둘러싸십시오. 검색 로봇은 이러한 태그 사이의 링크를 따르지 않습니다.
또 다른 방법은 MP3 파일의 URL을 제외 마스크로 추가하는 것입니다.
URL 마스크 스크립트 정보를 참조하십시오.

MP3 파일이 인덱싱되지 않도록 하려면 어떻게 해야 합니까?

계정에 대한 MP3 인덱싱을 제어하는 가장 쉬운 방법은 Text in MP3 Music Files Staged Content Types 페이지에서 선택을 취소하는 것입니다.
크롤링 및 색인을 위한 컨텐츠 유형 선택을 참조하십시오.
또한 URL 마스크 기능을 사용하여 파일 확장명에 의한 MP3 인덱싱을 비활성화할 수 있습니다. 이렇게 하려면 제품 메뉴에서 Settings > Crawling > URL Masks ​을 클릭합니다. 다음 마스크 중 하나를 입력합니다.
계정이
다음 URL 마스크 입력
정규 표현식을 사용하지 않음
exclude *.mp3
정규 표현식을 사용합니다.
regexp ^를 제외합니다.*\.mp3$

내 사이트에서 중국어, 일본어 또는 한국어 MP3 파일을 검색할 수 없는 이유는 무엇입니까?

중국어, 일본어 또는 한국어 MP3 파일을 검색하려면 제품 메뉴에서 Settings > Crawling > Content Types > Text in MP3 Music Files ​를 클릭합니다. 그런 다음 Settings > Metadata > Injections ​을 클릭하고 MP3 파일을 인코딩하는 데 사용되는 문자 집합을 지정합니다.
크롤링 및 색인을 위한 컨텐츠 유형 선택을 참조하십시오.

PDF 파일에서 색인이 되는 항목

PDF 파일의 전체 컨텐츠는 인덱싱됩니다. PDF 파일의 다음 부분은 인덱싱됩니다.
  • Title
  • 키워드
  • 제목(설명)
  • 텍스트 기반 컨텐츠

PDF 파일에서 색인이 되지 않는 것은 무엇입니까?

PDF 목차, 파일 내의 그래픽 또는 포함된 그래픽에 포함된 텍스트는 색인이 적용되지 않습니다.

색인화된 PDF 파일은 어떻게 카운트됩니까?

여러 페이지가 포함된 PDF를 포함하여 각 PDF 파일을 하나의 문서로 계산합니다.

검색 결과에 PDF 아이콘이 표시될 수 있습니까?

예. 템플릿 내의 <search-if-link-extension> 태그를 사용하여 검색 결과에 PDF 아이콘, 기타 그래픽 또는 텍스트를 포함할 수 있습니다.
<search-results> 
  ... 
  <search-if-link-extension value=".pdf"> 
    <img src="/search/i/pdficon.gif"> 
  </search-if-link-extension> 
  ... 
</search-results>

PDF 아이콘은 검색 결과가 매우 클 수 있는 PDF 파일에 연결된다는 것을 고객이 알 수 있도록 도와줍니다. 파일 크기는 모뎀이나 모바일 장치를 통해 웹 사이트에 액세스하는 고객에게 영향을 줄 수 있습니다.

검색 결과가 PDF 파일의 특정 페이지에 링크될 수 있습니까?

예. 고객은 스마트 링크 템플릿 태그( <search-smart-link>...</search-smart-link> )를 사용하여 검색 결과가 포함된 첫 번째 PDF 페이지를 클릭하여 열 수 있습니다.
스마트 링크를 사용하려면 템플릿의 검색 결과 섹션에 있는 <search-link>...</search-link> 태그를 <search-smart-link>...</search-smart-link> 태그로 바꿉니다. 고객은 스마트 링크 태그가 생성하는 링크를 클릭하면 검색 쿼리와 관련된 첫 번째 PDF 페이지로 이동합니다.
이 기능을 사용하려면 강조 표시 플러그인 및 EWH(External Window Handler) 플러그인이 포함되어야 하는 최신 버전의 Adobe Acrobat 또는 Adobe Acrobat Reader를 사용해야 합니다. 또한 웹 브라우저는 Netscape Navigator용 Adobe Acrobat 플러그인(이 Netscape Navigator 플러그인을 허용하는 모든 브라우저 사용 가능)이나 Internet Explorer 4.0 이상용 Acrobat ActiveX 컨트롤을 사용해야 합니다.
템플릿 태그 검색을 참조하십시오.

웹 사이트에서 PDF 파일이 색인화되지 않도록 하려면 어떻게 해야 합니까?

검색 로봇이 PDF 파일을 크롤링 및 색인화하지 않도록 하려면 컨텐츠 유형 PDF Documents ( Settings > Crawling > Content Types )을 선택 취소합니다.
PDF 색인을 비활성화할 URL Masks 수도 있습니다.
PDF 색인을 비활성화하려면 다음 URL 마스크 중 하나를 입력합니다.
  • exclude *.pdf (정규 표현식을 사용하지 않는 경우)
  • exclude regexp ^.*\.pdf$ (정규 표현식을 사용하는 경우)

웹 사이트에서 중국어, 일본어 또는 한국어 PDF 파일을 검색할 수 없는 이유는 무엇입니까?

사이트 검색/머천다이징은 PDF 파일에서 언어를 표시하지 않고 UTF-8을 가져옵니다. 콘텐트 유형을 선택한 PDF Documents 경우( Settings > Crawling > Content Types ) 메타데이터 주입을 사용하여 PDF 파일에 사용되는 언어를 지정해야 합니다.
필드 삽입 정의 추가를 참조하십시오.

페이지가 너무 많습니다.

인덱서가 실제로 있는 것보다 더 많은 페이지를 카운트한 이유 및 각 경우에 솔루션이 어떤 것인지를 설명하는 FAQ 페이지입니다.
웹 사이트가 페이지 제한보다 작다고 판단되지만 인덱서가 제한에 도달했다고 하는 경우 이러한 일반적인 질문과 대답을 검토하여 가능한 솔루션을 찾아야 합니다.

다양한 색인 로그를 검토하셨나요?

색인 로그는 웹 사이트를 색인화할 때 사이트 검색/머천다이징 로봇이 수집한 자세한 정보를 포함합니다. 로그에는 크롤링된 모든 링크 및 발생한 오류 목록이 포함되어 있습니다. 색인 로그를 검사하면 색인이 설정되는 페이지를 결정할 때 시작할 수 있는 최적의 장소입니다.
라이브 또는 스테이지 웹 사이트의 등급 다시 지정 색인 로그 보기를 참조하십시오.

CGI 프로그램이 웹 사이트에서 인덱싱되고 있습니까?

CGI 프로그램은 때로 인덱서가 여러 "가짜" URL을 크롤하도록 하는 URL 매개 변수를 사용합니다. 사이트 검색/머천다이징이 CGI 프로그램을 읽고 CGI 매개 변수가 포함된 URL을 팔로우하는 경우 검색 색인에 유용하지 않은 크롤링 및 인덱싱되는 여러 개의 페이지가 있을 수 있습니다. 일반적인 CGI 매개 변수는 ? 또는 & 문자가 있는 URL에 나타납니다.
URL 마스크 기능을 사용하여 CGI 프로그램이 인덱싱되지 않도록 마스크를 적용할 수 있습니다. URL 접두사를 마스크하거나 정규 표현식을 사용하여 CGI 스크립트를 마스크할 수 있습니다.
URL 마스크 스크립트 정보를 참조하십시오.

서버에서 디렉토리 검색을 활성화합니까?

웹 서버에 디렉토리 검색이 활성화되어 있고 해당 디렉토리에 index.html 파일이 없는 경우 해당 디렉토리를 방문하면 해당 디렉토리에 있는 파일의 목록이 표시됩니다. 일반적으로 페이지 맨 위에는 클릭, Last modified ​등을 통해 목록을 다른 방식으로 정렬할 수 있는 링크가 Size ​있습니다. 일반적으로 이러한 URL은 사이트 검색/머천다이징 색인 로그에 URL로 표시되며 ?M=A 끝에는 과 같은 문자가 있습니다. 사이트 검색/머천다이징 인덱서는 이러한 링크를 링크로 따르며, 이로 인해 여러 "위조" URL을 인덱싱할 수 있습니다.
일반적으로 잘 설계된 웹 사이트에는 모든 디렉토리에 인덱스 파일이 있거나 인덱스 파일이 없는 디렉토리에 대해 디렉토리 검색이 비활성화되어 있습니다. 다행히 페이지를 변경하거나 서버측에서 디렉토리 목록을 비활성화할 수 없는 경우 이러한 "가짜" URL을 마스크하는 쉬운 방법이 있습니다.
이 작업을 수행하려면 Settings > Crawling > URL Masks ​을 클릭합니다. 문자를 포함하는 URL에 마스크를 추가하여 마스크를 ? 적용합니다. 다음 정규 표현식 마스크를 입력하여 이 작업을 수행할 수 있습니다.
exclude regexp ^.*\?.*$
마스크를 만든 후 웹 사이트를 다시 색인화해야 합니다.

웹 사이트에 포럼이나 뉴스 그룹이 있습니까?

웹 사이트에서 포럼 또는 뉴스 그룹이 크롤되고 있는 경우 다른 표시 옵션 또는 정렬 옵션에 대해 URL을 팔로우할 수 있습니다. 이 동작은 동일한 페이지가 여러 번 인덱싱되었음을 의미합니다.
일반적으로 포럼이나 뉴스 그룹에는 자체 검색 엔진이 포함되어 있습니다. 이러한 경우 를 URL Masks 사용하여 사이트 검색/머천다이징에서 포럼에 마스크를 적용할 수 있습니다.
제품 메뉴에서 > Settings > Crawling > URL Masks ​을 클릭합니다. 페이지에서 URL을 제외 URL 마스크로 입력하여 포럼에 마스크를 적용합니다. Staged URL Masks
마스크를 만든 후 웹 사이트를 다시 색인화해야 합니다.

웹 사이트에 PDF 또는 Microsoft Office 파일이 있습니까?

웹 사이트에 PDF 파일 또는 Microsoft Office 파일이 있는 경우 몇 개의 파일의 인덱스 크기만 많은 페이지를 카운트한다는 것을 알 수 있습니다. PDF 또는 Microsoft Office 파일의 각 페이지가 별도의 페이지로 계산되기 때문에 현재 문서보다 색인이 많은 페이지가 있습니다.
제품 메뉴에서 > Index > Full Index > Live Index ​을 클릭합니다. 페이지에서 Full Index 선택한 Count All Pages ​다음 을 클릭하여 총 페이지 수를 Full Index Now 봅니다. PDF 파일 또는 Microsoft Office 파일의 색인을 원하지 않는 경우 Settings > Crawling > Content Types ​에서 이 콘텐트 유형을 비활성화할 수 있습니다.

여러 개의 URL 시작 지점이 있습니까?

사이트 검색/머천다이징 로봇은 지정된 URL 진입점에서 크롤링을 시작하고 해당 특정 도메인의 모든 컨텐츠에 대해 검색된 모든 링크를 따릅니다. 많은 URL 시작 지점을 지정한 경우 상당한 수의 페이지가 크롤될 수 있습니다.
추가 도메인의 시작 지점 문서 헤더에 있는 로봇 제외 프로토콜 nofollow 태그를 다음과 같이 사용하십시오.
<html> 
<head> 
<meta name="robots" content="nofollow"> 
</head>

위의 코드는 사이트 검색/머천다이징 로봇에 페이지 컨텐츠를 색인화하도록 지시하지만 추가 페이지에 대한 링크를 따라가지 않도록 합니다.
웹 로봇과 로봇 제외 프로토콜에 대한 자세한 내용은 다음 링크를 참조하십시오.
추가 도메인의 페이지 소스에 대한 액세스 권한이 없는 경우 여러 URL 진입점을 제거할 수 있습니다. 이렇게 하면 색인 활동을 고객이 검색할 수 있게 하려는 컨텐츠가 있는 도메인에만 제한할 수 있습니다.

사이트 검색/머천다이징의 내부 바이트 또는 시간 제한을 초과했습니다.

계정이 "전체 인덱스 상태" 화면에서 제한에 도달했는지 확인하십시오. 상태 보고서에서 인덱스가 허용된 것보다 크거나 허용된 것보다 많은 시간이 걸렸다고 보고하는 경우 웹 사이트가 완전히 인덱싱되지 않습니다. 적절한 범위 및 웹 사이트 페이지 카운트를 받으려면 이 오류를 수정할 수 있습니다.
사이트 검색/머천다이징 서버를 보호하기 위해 바이트 및 시간에 대한 내부 제한이 있습니다. 크롤링된 파일이 매우 큰 경우 또는 사이트 검색/머천다이징의 도달 수가 느려지는 경우에만 이러한 제한에 도달했습니다.
시간 제한에 도달하는 경우 서버가 온라인 상태인지 확인하고 나중에 색인을 다시 시도하십시오. 바이트 제한에 도달하는 경우 인덱스 로그를 확인하여 크롤링된 파일을 확인합니다. 비정상적으로 크나요? 이러한 메시지 중 하나가 표시되면 기술 지원에 문의하십시오.