Show Menu
화제×

규칙 다시 작성 메뉴 정보

규칙 다시 작성 메뉴를 사용하여 크롤링 및 검색 URL 및 제목 규칙을 설정합니다.

크롤링 목록 저장소 URL 규칙 정보

크롤링 URL 규칙은 웹 컨텐츠 내에서 발생하는 URL을 어떻게 다시 작성하는지를 지정합니다. 규칙 및 조건 수를 제한 없이 지정할 수 있으며 발생한 URL의 모든 부분을 조작할 수 있습니다.
크롤링 규칙은 URL의 동적 부분(예: 웹 사이트를 방문하는 각 고객에 대해 고유한 세션 식별자)을 재작성하는 데 가장 유용합니다. 다시 작성 규칙을 사용하여 쿼리 매개 변수와 같은 URL의 부분을 검색 로봇에서 숨길 수도 있습니다. 기본적으로 규칙은 지정되지 않으며 URL 재작성을 수행하지 않습니다.
웹 사이트가 크롤되면 포함된 컨텐츠 URL은 크롤할 추가 웹 페이지의 임시 목록에 저장됩니다. 이 목록에 URL을 추가하기 전에 스토어 다시 작성 규칙이 적용됩니다. 일반적으로 저장소 재작성 규칙은 URL에서 세션 ID를 제거하거나 크롤링을 위해 특정 세션 ID를 적용하는 데 사용됩니다. 검색 로봇이 목록에서 URL을 검색할 때 다시 쓰기 규칙을 사용하여 해당 URL의 부분을 다시 조작합니다. 일반적으로 검색 규칙은 시간 구분 데이터를 URL에 다시 삽입하는 데 사용됩니다. 웹 사이트에서 페이지를 실제로 검색하는 데 사용되는 이 최종 URL입니다.
일반적으로 저장소 URL 규칙만 사용합니다. URL 규칙 검색은 URL에 세션 ID와 같은 동적 데이터가 포함되어 있고 동적 데이터가 시간 경과에 따라 변경되더라도 유효하게 유지됩니다. 이 경우 URL 저장 규칙을 사용하여 발견된 URL에서 데이터의 최신 상태를 가져옵니다. 그런 다음 검색 로봇이 페이지를 검색하려고 할 때 URL 규칙 검색을 사용하여 해당 데이터를 각 URL에 추가합니다.
각 규칙은 다시 작성 규칙(RewriteRule) 지시문과 하나 이상의 선택적 다시 작성 조건(RewriteCond)을 사용하여 지정됩니다. 규칙의 순서는 중요합니다. 규칙 세트는 규칙별로 규칙을 통해 반복됩니다. 규칙이 일치하면 해당 다시 작성 조건을 통해 반복됩니다. 크롤링 URL 규칙은 다음과 같은 방법으로 지정됩니다.
RewriteCond TestString CondPattern [Flags] 
RewriteRule Pattern Substitution [Flags]

포함된 URL이 발생하면 검색 로봇은 URL을 각 크롤링 규칙의 패턴과 일치시킵니다. 패턴이 일치하는 경우 다시 작성 엔진은 해당 RewriteCond 지시문을 찾습니다. 조건이 없는 경우 URL은 대체 문자열에서 생성된 새 값으로 대체되고 규칙 세트의 다음 규칙으로 계속됩니다. 조건이 있으면 나열된 순서대로 처리됩니다. 다시 작성 엔진은 테스트 문자열(TestString)과 조건 패턴(CondPattern)을 일치시키려고 합니다. 두 일치 조건이 있으면 사용 가능한 조건이 없을 때까지 다음 조건이 처리됩니다. 모든 조건이 일치하는 경우 URL은 규칙에 지정된 대체로 대체됩니다. 조건이 충족되지 않으면 전체 조건 세트와 해당 규칙이 실패합니다.

RewriteRule 지시문 정보

RewriteRule 지시문에는 다음 양식이 있습니다.
           
<i>RewriteRule Pattern Substitution [Flags]</i> 
        

Pattern 현재 URL에 적용되는 POSIX 정규 표현식이 될 수 있습니다. 이전 규칙이 이미 일치하고 URL을 변경했을 수 있으므로 "현재 URL"은 원래 요청된 URL과 다를 수 있습니다.
"not" 문자('!')는 사용할 수 없습니다. 에 접두사를 붙입니다. "not" 문자를 사용하면 패턴을 무효화할 수 있습니다. 즉, 현재 URL이 이 패턴과 일치하지 않는 경우에만 true입니다. "not" 문자는 네거티브 패턴과 일치하거나 최종 기본 규칙으로 사용할 수 있습니다.
"not" 문자와 그룹화된 와일드카드를 모두 패턴에 사용할 수 없습니다. 또한 대체 문자열에 $N이 들어 있는 경우 무효화된 패턴을 사용할 수 없습니다.
괄호를 사용하여 대체 및 CondPattern에서 참조할 수 있는 패턴의 역참조를 만들 수 있습니다.
대체 URL은 다음을 포함하는 대체 문자열로 대체됩니다.
일반 텍스트:변경되지 않은 상태로 전달된 텍스트입니다.
역참조를 사용하면 Pattern 또는 CondPattern의 그룹화된 부품(괄호 안)에 액세스할 수 있습니다. 다음은 두 가지 유형의 역참조입니다.
  • RewriteRule Backreferences 해당 RewriteRule 패턴의 이러한 일치 역참조를 사용하고 $N(0 <= N <= 9) 형식을 사용합니다. 예, RewriteRule ^https:// ([^/]*) (.*)$ https://${tolower: $1} $2.
  • RewriteCond 역참조 마지막 일치 RewriteCondPattern에서 이러한 일치 역참조를 사용하고 %N(0 <= N <= 9) 형식을 사용합니다.
변수:다음은 % 형식의 변수입니다. 여기서 NAME_OF_VARIABLE은 정의된 변수의 이름에 대한 문자열입니다. 환경 변수 설정에 대한 자세한 내용은 *[E]* 플래그를 참조하십시오.
함수:$ 형식의 함수입니다. 여기서 NAME_OF_FUNCTION은 다음과 같습니다.
  • Tolower는 소문자에서 모든 문자를 만듭니다.
  • toupper는 모든 문자를 대문자로 만듭니다.
  • escape URL은 키의 ​모든 문자를 인코딩합니다.
  • 'a'..'z', 'A'.'Z', '0'..'9', '*', '-', '.', '/', '@' 및 '_'는 변경되지 않았습니다.공백은 '+'로 번역되며 다른 모든 문자는 %xx URL 인코딩된 상응하는 문자로 변환됩니다.
  • escape는 '+'를 다시 공백으로 변환하고 모든 %xx URL 인코딩 문자를 다시 단일 문자로 변환합니다.
특수 대체 문자열이 있습니다."대용 금지" '-' 를 의미합니다. 이 '-' 문자열은 종종 C(체인) 플래그와 함께 사용되므로 대체를 하기 전에 URL을 여러 패턴과 일치시킬 수 있습니다.
플래그
(선택 사항) 플래그를 대괄호로 묶습니다 [] . 여러 개의 플래그는 쉼표로 구분됩니다.
플래그
설명
'last|L'
마지막 규칙.
다시 작성 프로세스를 중지하고 추가 재작성 규칙을 적용하지 않습니다. 현재 URL에 대한 추가 처리를 방지하려면 이 플래그를 사용합니다.
'next|N'
다음 단계
첫 번째 다시 작성 규칙으로 다시 시작하여 마지막 다시 작성 규칙의 URL을 사용하여 다시 작성 프로세스를 실행합니다(원래 URL이 아님). 자중고리를 만들지 않도록 조심해!
'chain|C'
다음 규칙과 연계되어 있습니다.
현재 규칙을 다음 규칙에 체인으로 연결(다음 규칙에 체인으로 연결할 수도 있음) 규칙이 일치하면 대체 프로세스가 평소대로 계속됩니다. 규칙이 일치하지 않으면 이후의 모든 체인 규칙을 건너뜁니다.
'nocase|NC'
케이스 없이
패턴이 현재 URL과 일치할 때 패턴을 대/소문자를 구분하지 않도록 합니다(즉, 'A-Z'와 'a-z' 사이에 차이가 없습니다).
'skip|S=num'
다음 규칙 또는 규칙을 건너뜁니다.
현재 규칙이 일치하는 경우 이 플래그는 다시 작성 엔진을 강제로 규칙 세트의 다음 num 규칙을 건너뜁니다. 이 플래그를 사용하여 의사 if-then-else 구문을 만듭니다. then-절의 마지막 규칙은 skip=N이 됩니다. 여기서 N은 else-절의 규칙 수입니다.
참고: 이 플래그는 'chain|C' 플래그와 같지 않습니다.)
'env|E=VAR:VAL'
환경 변수를 설정합니다.
값 VAL에 설정된 환경 변수 "VAR"를 만듭니다. 여기서 VAL은 확장되는 정규 표현식 역참조, $N 및 %N을 포함할 수 있습니다. 이 플래그를 두 번 이상 사용하여 여러 변수를 설정할 수 있습니다. 이 변수는 나중에 %{VAR}을(를) 통해 다음 RewriteCond 패턴에서 역참조될 수 있습니다.
이 플래그를 사용하여 URL의 정보를 제거하고 기억하십시오.
저장소 다시 작성 규칙 및 다시 작성 규칙 검색은 변수 값을 공유합니다. 이러한 비헤이비어로 인해 포함된 URL이 발견되어 저장될 때 변수를 시간 구분 세션 ID 값으로 설정할 수 있습니다. 임시 저장소 목록에서 다음 URL을 검색할 때 해당 페이지를 검색하기 전에 최신 세션 ID 값을 추가할 수 있습니다.
함수가 있는 RewriteRule 예
문자열을 "www.mydomain.com" "www.MyDomain.com" 다르게 처리하는 대소문자를 구분하는 서버가 있다고 가정합니다. 서버가 제대로 작동하려면 일부 문서에 참조하는 링크가 포함되어 "www.mydomain.com" 있더라도 도메인이 항상 "www.MyDomain.com." 유지되도록 하려면 다음 규칙을 사용합니다.
RewriteRule  ^https:// 
<b>([^/]*)</b> 
<i>(.*)</i>$  https://${tolower:$1}$2

이 다시 작성 규칙은 함수를 tolower 사용하여 URL의 도메인 부분을 다시 작성함으로써 다음과 같이 항상 소문자로 표시되도록 합니다.
  1. 패턴에는 URL (^https://([^/]*)(.*)$) 의 첫 문자와 첫 번째 사이의 모든 문자와 ([^/]*) https:// / 일치하는 역참조가 포함되어 있습니다. 또한 패턴에는 URL의 나머지 모든 문자와 일치하는 두 번째 역참조도 (.*) 포함되어 있습니다.
  2. 대체 (https://${tolower:$1}$2) 기능은 검색 엔진에서 첫 번째 역참조에서 tolower 함수를 사용하여 URL의 나머지 부분은 그대로 (https:// ${tolower:$1}$2) 남겨 두도록 지시합니다 (https://${tolower:$1} $2) .
따라서 양식의 URL이 https://www.MyDomain.com/INTRO/index.Html 다시 작성됩니다 https://www.mydomain.com/INTRO/index.Html .

RewriteCond 지시문 정보

RewriteCond 지시문은 규칙 조건을 정의합니다. RewriteCond가 RewriteRule 앞에 있으면 해당 패턴이 현재 제목과 일치하고 추가 조건이 적용되는 경우에만 규칙이 사용됩니다. 재작성 조건에는 다음 양식이 필요합니다.
           
<i>RewriteCond TestString CondPattern [Flags]</i> 
        

TestString 은 다음 구문을 포함할 수 있는 문자열입니다.
일반 텍스트:변경되지 않은 상태로 전달된 텍스트입니다.
역참조를 사용하면 Pattern 또는 CondPattern의 그룹화된 부품(괄호 안)에 액세스할 수 있습니다. 다음은 두 가지 유형의 역참조입니다.
  • RewriteRule Backreferences 해당 RewriteRule 패턴의 이러한 일치 역참조를 사용하고 $N(0 <= N <= 9) 형식을 사용합니다. 예, RewriteRule ^https:// ([^/]*) (.*)$ https://${tolower: $1} $2 .
  • RewriteCond 역참조 마지막 일치 RewriteCondPattern에서 이러한 일치 역참조를 사용하고 %N(0<= N <= 9) 형식을 사용합니다.
변수:이러한 변수는 % 형식의 변수입니다. 여기서 NAME_OF_VARIABLE은 정의된 변수의 이름에 대한 문자열이 될 수 있습니다. 변수 설정에 대한 자세한 내용은 RewriteRule [E] 플래그를 참조하십시오.
함수:$ 형식의 함수입니다. 여기서 NAME_OF_FUNCTION은 다음과 같습니다.
  • Tolower는 소문자에서 모든 문자를 만듭니다.
  • toupper는 모든 문자를 대문자로 만듭니다.
  • escape URL은 키의 모든 문자를 인코딩합니다. 'a'..'z', 'A'.'Z', '0'..'9', '*', '-', '.', '/', '@' 및 '_'는 변경되지 않고 그대로 유지되고 공백은 '+'로 변환되며 다른 모든 문자는 URL 인코딩된 %xx 상응하는 것으로 변환됩니다.
  • escape는 '+'를 다시 공백으로 변환하고 모든 %xx URL은 문자를 다시 단일 문자로 인코딩합니다.
CondPattern 은 일부 추가가 있는 표준 확장 정규 표현식입니다. 패턴 문자열 앞에 ! 문자(느낌표)가 추가되어 일치하지 않는 패턴을 지정할 수 있습니다. 실제 정규 표현식 문자열 대신 다음 특수 변형 중 하나를 사용할 수 있습니다.
이러한 모든 테스트에 느낌표('!')를 접두사로 사용할 수도 있습니다. 그들의 의미를 무시하다.
CondPattern 문자열
설명
'<CondPattern'
어휘 없이
CondPattern을 일반 문자열로 취급하여 TestString과 사전적으로 비교합니다. TestString이 CondPattern보다 사전적으로 작으면 true입니다.
'>CondPattern'
보다 풍부해진 워크플로우
CondPattern을 일반 문자열로 취급하여 TestString과 사전적으로 비교합니다. TestString이 CondPattern보다 사전적으로 큰 경우 True입니다.
'=CondPattern'
어휘 동등한
CondPattern을 일반 문자열로 취급하여 TestString과 사전적으로 비교합니다. TestString이 CondPattern과 사전적으로 같으면 true입니다. 즉, 두 문자열은 정확히 동일합니다(문자별로). CondPattern이 ""(두 개의 따옴표)일 경우 TestString과 빈 문자열을 비교합니다.
플래그 (선택 사항) 플래그를 대괄호로 묶습니다 [] . 여러 개의 플래그는 쉼표로 구분됩니다.
플래그
설명
'nocase|NC'
케이스 없이
이 플래그는 테스트를 대/소문자를 구분하지 않도록 합니다. 즉, 확장된 TestString과 CondPattern에서 모두 'A-Z'와 'a-z'는 차이가 없습니다.
'ornext|OR'
다음 상태
이 플래그를 사용하여 규칙 조건을 암시적 AND 대신 로컬 OR과 결합합니다. 이 플래그가 없으면, 콘드/규칙을 여러 번 작성해야 합니다.
일부 웹 페이지는 방문자가 처음으로 사이트에 도달할 때 "sessionid" CGI 변수를 할당합니다. 이 변수는 방문자를 식별하는 데 사용되며 방문자가 사이트를 탐색할 때 변수가 전달됩니다. 검색 로봇은 사이트의 방문자 모양이므로 "sessionid" 숫자가 할당됩니다. 검색 로봇은 두 번째 사이트 페이지에서 새 값을 지정하려고 해도 이 단일 "sessionid" 값을 유지합니다. 이를 위해서는 두 개의 다시 작성 규칙이 필요합니다.
첫 번째 규칙은 세션 ID 변수를 식별하고 저장하는 데 사용됩니다.
RewriteCond  %{sessionid}  !.+ 
RewriteRule  ^.+sessionid= 
<b>([^&#]+)</b>.*$  -   
<i>[E=sessionid:$1]</i>

RewriteRule은 E-플래그를 ([E=sessionid:$1]) 사용하여 sessionid CGI 매개 변수의 현재 값을 변수에 sessionid 지정합니다. RewriteRule $1 의 패턴에서 첫 번째 괄호 집합 사이에 들어 있는 첫 번째 역참조를 참조합니다 ([^&#]+) .
정규 표현식은 단어와 다음 ^&#]+ 문자 사이의 URL 부분과 sessionid **&**or**#** 일치합니다. 이 RewriteRule은 세션 ID 변수의 초기 값을 만드는 데만 사용되므로 다시 작성되지 않습니다. 규칙의 대체 필드는 재작성이 필요하지 않음을 - 나타내도록 설정되어 있습니다.
RewriteCond는 변수 sessionid ( %{sessionid} )를 조사합니다. 단 하나의 문자(!.+), 그런 다음 RewriteRule이 일치합니다.
이 규칙을 사용하면 URL이 https://www.domain.com/home/?sessionid=1234&function=start 다음으로 읽히고 변수에 값을 1234 할당합니다 sessionid .
두 번째 규칙은 다음 RewriteRule 패턴과 일치하는 모든 URL을 다시 작성하는 데 사용됩니다.
RewriteRule   
<b>^(.+)</b>sessionid=[^&#]+ 
<i>(.*)$</i>  $1sessionid=%{sessionid}$2

RewriteRule 패턴에는 다음 두 가지 역참조가 포함되어 있습니다. (.+) (.*) Adobe 첫 번째 역참조는 앞에 있는 모든 문자와 일치합니다 sessionid . 두 번째 역참조는 종료 & 또는 종료 후 모든 문자와 일치합니다 # .
대체 패턴은 첫 번째 역참조를 사용하여 URL을 다시 작성하고, 그 다음에 "sessionid=" 문자열이 오고, 첫 번째 규칙에 의해 정의된 세션 ID 변수의 값이 %{sessionid} 뒤에 두 번째 역참조를 사용하여 URL을 다시 작성합니다. ($1sessionid=%{sessionid} $2)
이 RewriteRule에 RewriteCond가 포함되어 있지 않습니다. 따라서 RewriteRule 패턴과 일치하는 모든 URL에 대해 다시 작성하게 됩니다 . 따라서 sessionid 변수( %{sessionid} )의 값이 1234``https://www.domain.com/products/?sessionid=5678&function=buy 이면 양식의 URL이 https://www.domain.com/products/?sessionid=1234&function=buy

감사의 말

다시 작성 엔진 소프트웨어는 원래 Apache Group에서 개발하여 Apache HTTP 서버 프로젝트(https://www.apache.org/)에서 사용할 수 있었습니다.

크롤링 목록 저장소 URL 규칙 추가

크롤링 목록 저장소 URL 규칙을 추가하여 웹 콘텐츠 내에서 발생하는 URL을 어떻게 다시 작성하는지를 지정할 수 있습니다. 규칙 및 조건 수를 제한 없이 지정할 수 있으며 발생한 URL의 모든 부분을 조작할 수 있습니다.
크롤링 목록 저장소 URL 규칙을 추가하려면
  1. 제품 메뉴에서 > Settings > Rewrite Rules > Crawl List Store URL Rules ​을 클릭합니다.
  2. 필드에 원하는 규칙을 Crawl List Store URL Rules 입력합니다.
    '#'(해시) 문자로 시작하는 빈 줄 및 주석 줄이 허용됩니다.
  3. (선택 사항) Crawl List Store URL Rules 페이지의 Test Crawl List Store URL Rules 필드에 테스트하려는 크롤링 규칙이 있는 테스트 URL을 입력한 다음 테스트를 클릭합니다 .
  4. 변경 내용 저장 ​을 클릭합니다.
  5. (선택 사항) 결과를 미리 보려는 경우 스테이지된 사이트 인덱스를 다시 작성합니다.
    스테이지된 웹 사이트의 증분 인덱스 구성을 참조하십시오.
  6. (선택 사항) Crawl List Store URL Rules 페이지에서 다음 중 하나를 수행합니다.
    • 아이콘을 History 클릭하여 변경한 내용을 되돌립니다.
      작업 내역 옵션 사용을 참조하십시오.
    • 클릭 Live .
      라이브 설정 보기를 참조하십시오.
    • 클릭 Push Live .
      스테이지 설정 라이브를 참조하십시오.

크롤링 목록 검색 URL 규칙 정보

크롤링 URL 규칙은 웹 콘텐츠 내에서 발생하는 URL을 어떻게 다시 작성하는지를 지정합니다. 규칙 및 조건 수를 제한 없이 지정할 수 있으며 발생한 URL의 모든 부분을 조작할 수 있습니다.
규칙이 고객에게 미치는 영향을 확인하려면 먼저 사이트 인덱스를 다시 구성해야 합니다.
크롤링 규칙은 URL의 동적 부분(예: 웹 사이트를 방문하는 각 고객에 대해 고유한 세션 식별자)을 재작성하는 데 가장 유용합니다. 다시 작성 규칙을 사용하여 쿼리 매개 변수와 같은 URL의 부분을 검색 로봇에서 숨길 수도 있습니다. 기본적으로 규칙은 지정되지 않으며 URL 재작성을 수행하지 않습니다.
웹 사이트가 크롤되면 포함된 컨텐츠 URL은 크롤할 추가 웹 페이지의 임시 목록에 저장됩니다. 검색 로봇이 목록에서 URL을 검색하면 해당 URL의 부분을 조작하는 데 다시 작성 규칙 검색이 사용됩니다. 일반적으로 검색 규칙은 시간 구분 데이터를 URL에 삽입하는 데 사용됩니다. 웹 사이트에서 페이지를 실제로 검색하는 데 사용되는 이 최종 URL입니다.
다시 작성 규칙 검색은 URL에 세션 ID와 같은 동적 데이터가 포함되어 있고 동적 데이터가 시간 경과에 따라 변경되더라도 유효하게 유지됩니다. 이 경우 다시 작성 규칙 저장을 사용하여 발견된 URL에서 데이터의 최신 상태를 가져옵니다. 그런 다음 다시 작성 규칙 검색을 사용하여 검색 로봇이 페이지를 검색할 때 각 URL에 해당 데이터를 추가합니다.
각 규칙은 다시 작성 규칙(RewriteRule) 지시문과 하나 이상의 선택적 다시 작성 조건(RewriteCond)을 사용하여 지정됩니다. 규칙의 순서는 중요합니다. 규칙 세트는 규칙별로 규칙을 통해 반복됩니다. 규칙이 일치하면 해당 다시 작성 조건을 통해 반복됩니다. 크롤링 URL 규칙은 다음과 같은 방법으로 지정됩니다.
RewriteCond TestString CondPattern [Flags] 
RewriteRule Pattern Substitution [Flags]

포함된 URL이 발생하면 검색 로봇은 URL을 각 크롤링 규칙의 패턴과 일치시킵니다. 패턴이 일치하는 경우 다시 작성 엔진은 해당 RewriteCond 지시문을 찾습니다. 조건이 없는 경우 URL은 대체 문자열에서 생성된 새 값으로 대체되고 규칙 세트의 다음 규칙으로 계속됩니다. 조건이 있으면 나열된 순서대로 처리됩니다. 다시 작성 엔진은 테스트 문자열(TestString)과 조건 패턴(CondPattern)을 일치시키려고 합니다. 두 일치 조건이 있으면 사용 가능한 조건이 없을 때까지 다음 조건이 처리됩니다. 모든 조건이 일치하는 경우 URL은 규칙에 지정된 대체로 대체됩니다. 조건이 충족되지 않으면 전체 조건 세트와 해당 규칙이 실패합니다.

RewriteRule 지시문 정보

RewriteRule 지시문에는 다음 양식이 있습니다.
           
<i>RewriteRule Pattern Substitution [Flags]</i> 
        

Pattern 현재 URL에 적용되는 POSIX 정규 표현식이 될 수 있습니다. 이전 규칙이 이미 일치하고 URL을 변경했을 수 있으므로 "현재 URL"은 원래 요청된 URL과 다를 수 있습니다.
"not" 문자('!')는 사용할 수 없습니다. 에 접두사를 붙입니다. "not" 문자를 사용하면 패턴을 무효화할 수 있습니다. 즉, 현재 URL이 이 패턴과 일치하지 않는 경우에만 true입니다. "not" 문자는 네거티브 패턴과 일치하거나 최종 기본 규칙으로 사용할 수 있습니다.
"not" 문자와 그룹화된 와일드카드를 모두 패턴에 사용할 수 없습니다. 또한 대체 문자열에 $N이 들어 있는 경우 무효화된 패턴을 사용할 수 없습니다.
괄호를 사용하여 대체 및 CondPattern에서 참조할 수 있는 패턴의 역참조를 만들 수 있습니다.
대체 URL은 다음을 포함하는 대체 문자열로 대체됩니다.
일반 텍스트:변경되지 않은 상태로 전달된 텍스트입니다.
역참조를 사용하면 Pattern 또는 CondPattern의 그룹화된 부품(괄호 안)에 액세스할 수 있습니다. 다음은 두 가지 유형의 역참조입니다.
  • RewriteRule Backreferences 해당 RewriteRule 패턴의 이러한 일치 역참조를 사용하고 $N(0 <= N <= 9) 형식을 사용합니다. 예, RewriteRule ^https:// ([^/]*) (.*)$ https://${tolower: $1} $2.
  • ** RewriteCond 역참조** 마지막 일치 RewriteCondPattern에서 이러한 일치 역참조를 사용하고 %N(0 <= N <= 9) 형식을 사용합니다.
변수:다음은 % 형식의 변수입니다. 여기서 NAME_OF_VARIABLE은 정의된 변수의 이름에 대한 문자열입니다. 환경 # 대한 자세한 내용은 E 플래그를 참조하십시오.
함수:$ 형식의 함수입니다. 여기서 NAME_OF_FUNCTION은 다음과 같습니다.
  • Tolower는 소문자에서 모든 문자를 만듭니다.
  • toupper는 모든 문자를 대문자로 만듭니다.
  • escape URL은 키의 ​모든 문자를 인코딩합니다.
  • 'a'..'z', 'A'.'Z', '0'..'9', '*', '-', '.', '/', '@' 및 '_'는 변경되지 않았습니다.공백은 '+'로 번역되며 다른 모든 문자는 %xx URL 인코딩된 상응하는 문자로 변환됩니다.
  • escape는 '+'를 다시 공백으로 변환하고 모든 %xx URL 인코딩 문자를 다시 단일 문자로 변환합니다.
특수 대체 문자열이 있습니다.'-'는 "대체가 없습니다"를 의미합니다. '-' 문자열은 종종 C(체인) 플래그와 함께 사용되므로 대체가 발생하기 전에 URL을 여러 패턴과 일치시킬 수 있습니다.
플래그
플래그
설명
'last|L'
마지막 규칙.
다시 작성 프로세스를 중지하고 추가 재작성 규칙을 적용하지 않습니다. 현재 URL에 대한 추가 처리를 방지하려면 이 플래그를 사용합니다.
'next|N'
다음 단계
첫 번째 다시 작성 규칙으로 다시 시작하여 마지막 다시 작성 규칙의 URL을 사용하여 다시 작성 프로세스를 실행합니다(원래 URL이 아님). 무결점을 만들지 않도록 주의해라.
'chain|C'
다음 규칙과 연계되어 있습니다.
현재 규칙을 다음 규칙에 체인으로 연결(다음 규칙에 체인으로 연결할 수도 있음) 규칙이 일치하면 대체 프로세스가 평소대로 계속됩니다. 규칙이 일치하지 않으면 이후의 모든 체인 규칙을 건너뜁니다.
'nocase|NC'
케이스 없이
패턴이 현재 URL과 일치할 때 패턴을 대/소문자를 구분하지 않도록 합니다(즉, 'A-Z'와 'a-z' 사이에 차이가 없습니다).
'skip|S=num'
다음 규칙 또는 규칙을 건너뜁니다.
현재 규칙이 일치하는 경우 이 플래그는 다시 작성 엔진을 강제로 규칙 세트의 다음 num 규칙을 건너뜁니다. 이 플래그를 사용하여 의사 if-then-else 구문을 만듭니다. then-절의 마지막 규칙은 skip=N이 됩니다. 여기서 N은 else-절의 규칙 수입니다.
참고: 이 플래그는 'chain|C' 플래그와 같지 않습니다.)
'env|E=VAR:VAL'
환경 변수를 설정합니다.
값 VAL에 설정된 환경 변수 "VAR"를 만듭니다. 여기서 VAL은 확장되는 정규 표현식 역참조, $N 및 %N을 포함할 수 있습니다. 이 플래그를 두 번 이상 사용하여 여러 변수를 설정할 수 있습니다. 이 변수는 나중에 %{VAR}을(를) 통해 다음 RewriteCond 패턴에서 역참조될 수 있습니다.
이 플래그를 사용하여 URL의 정보를 제거하고 기억하십시오.
저장소 다시 작성 규칙 및 다시 작성 규칙 검색은 변수 값을 공유합니다. 이러한 비헤이비어로 인해 포함된 URL이 발견되어 저장될 때 변수를 시간 구분 세션 ID 값으로 설정할 수 있습니다. 임시 저장소 목록에서 다음 URL을 검색할 때 해당 페이지를 검색하기 전에 최신 세션 ID 값을 추가할 수 있습니다.
함수가 있는 RewriteRule 예
"www.mydomain.com" 및 "www.MyDomain.com" 문자열을 다르게 처리하는 대소문자를 구분하는 서버가 있다고 가정합니다. 서버가 올바르게 작동하려면 일부 문서에 "www.MyDomain.com"을 참조하는 링크가 포함되어 있더라도 도메인이 항상 "www.mydomain.com"인지 확인하십시오. 이렇게 하려면 다음 규칙을 사용할 수 있습니다.
RewriteRule  ^https:// 
<b>([^/]*)</b> 
<i>(.*)</i>$  https://${tolower:$1}$2

이 다시 작성 규칙은 함수를 tolower 사용하여 URL의 도메인 부분을 다시 작성함으로써 다음과 같이 항상 소문자로 표시되도록 합니다.
  1. 패턴에는 (^https://([^/]*)(.*)$) URL의 첫 문자와 첫 번째 사이의 모든 문자와 일치하는 역참조 *** ([^/]*) *가 https:// 포함되어 / 있습니다. 또한 패턴에는 URL의 나머지 모든 문자와 일치하는 두 번째 역참조도 (.*) 포함되어 있습니다.
  2. 대체 (https://${tolower:$1}$2) 기능은 검색 엔진에서 첫 번째 역참조에서 tolower 함수를 사용하여 URL의 나머지 부분은 그대로 (https:// ${tolower:$1}$2) 남겨 두도록 지시합니다 (https://${tolower:$1} $2) .
따라서 양식의 URL이 https://www.MyDomain.com/INTRO/index.Html 다시 작성됩니다 https://www.mydomain.com/INTRO/index.Html .

RewriteCond 지시문 정보

RewriteCond 지시문은 규칙 조건을 정의합니다. RewriteCond가 RewriteRule 앞에 있으면 해당 패턴이 현재 제목과 일치하고 추가 조건이 적용되는 경우에만 규칙이 사용됩니다. 재작성 조건에는 다음 양식이 필요합니다.
           
<i>RewriteCond TestString CondPattern [Flags]</i> 
        

TestString 은 다음 구문을 포함할 수 있는 문자열입니다.
일반 텍스트:변경되지 않은 상태로 전달된 텍스트입니다.
역참조를 사용하면 Pattern 또는 CondPattern의 그룹화된 부품(괄호 안)에 액세스할 수 있습니다. 다음은 두 가지 유형의 역참조입니다.
  • RewriteRule Backreferences 해당 RewriteRule 패턴의 이러한 일치 역참조를 사용하고 $N(0 <= N <= 9) 형식을 사용합니다. 예, RewriteRule ^https:// ([^/]*) (.*)$ https://${tolower: $1} $2 .
  • RewriteCond 역참조 마지막 일치 RewriteCondPattern에서 이러한 일치 역참조를 사용하고 %N(0<= N <= 9) 형식을 사용합니다.
변수:이러한 변수는 % 형식의 변수입니다. 여기서 NAME_OF_VARIABLE은 정의된 변수의 이름에 대한 문자열이 될 수 있습니다. 변수 설정에 대한 자세한 내용은 RewriteRule [E] 플래그를 참조하십시오.
함수:$ 형식의 함수입니다. 여기서 NAME_OF_FUNCTION은 다음과 같습니다.
  • Tolower는 소문자에서 모든 문자를 만듭니다.
  • toupper는 모든 문자를 대문자로 만듭니다.
  • escape URL은 키의 모든 문자를 인코딩합니다. 'a'..'z', 'A'.'Z', '0'..'9', '*', '-', '.', '/', '@' 및 '_'는 변경되지 않고 그대로 유지되고 공백은 '+'로 변환되며 다른 모든 문자는 %xx URL 인코딩된 상응하는 문자로 변환됩니다.
  • escape는 '+'를 다시 공백으로 변환하고 모든 %xx URL은 문자를 다시 단일 문자로 인코딩합니다.
CondPattern 은 일부 추가가 있는 표준 확장 정규 표현식입니다. 패턴 문자열 앞에 '!'를 추가할 수 있습니다. 문자(느낌표)를 사용하여 일치하지 않는 패턴을 지정합니다. 실제 정규 표현식 문자열 대신 다음 특수 변형 중 하나를 사용할 수 있습니다.
이러한 모든 테스트에 느낌표('!')를 접두사로 사용할 수도 있습니다. 그들의 의미를 무시하다.
CondPattern 문자열
설명
'<CondPattern'
어휘 없이
CondPattern을 일반 문자열로 취급하여 TestString과 사전적으로 비교합니다. TestString이 CondPattern보다 사전적으로 작으면 true입니다.
'>CondPattern'
보다 풍부해진 워크플로우
CondPattern을 일반 문자열로 취급하여 TestString과 사전적으로 비교합니다. TestString이 CondPattern보다 사전적으로 큰 경우 True입니다.
'=CondPattern'
어휘 동등한
CondPattern을 일반 문자열로 취급하여 TestString과 사전적으로 비교합니다. TestString이 CondPattern과 사전적으로 같으면 true입니다. 즉, 두 문자열은 정확히 동일합니다(문자별로). CondPattern이 ""(두 개의 따옴표)일 경우 TestString과 빈 문자열을 비교합니다.
플래그 (선택 사항) 플래그를 대괄호로 묶습니다 [] . 여러 개의 플래그는 쉼표로 구분됩니다.
플래그
설명
'nocase|NC'
케이스 없이
이 플래그는 테스트를 대/소문자를 구분하지 않도록 합니다. 즉, 확장된 TestString과 CondPattern에서 모두 'A-Z'와 'a-z'는 차이가 없습니다.
'ornext|OR'
다음 상태
이 플래그를 사용하여 규칙 조건을 암시적 AND 대신 로컬 OR과 결합합니다. 이 플래그가 없으면, 콘드/규칙을 여러 번 작성해야 합니다.
일부 웹 페이지는 방문자가 처음으로 사이트에 도달할 때 "sessionid" CGI 변수를 할당합니다. 이 변수는 방문자를 식별하는 데 사용되며 방문자가 사이트를 탐색할 때 변수가 전달됩니다. 검색 로봇은 사이트의 방문자 모양이므로 "sessionid" 숫자가 할당됩니다. 검색 로봇은 두 번째 사이트 페이지에서 새 값을 지정하려고 해도 이 단일 "sessionid" 값을 유지합니다. 이를 위해서는 두 개의 다시 작성 규칙이 필요합니다.
첫 번째 규칙은 세션 ID 변수를 식별하고 저장하는 데 사용됩니다.
RewriteCond  %{sessionid}  !.+ 
RewriteRule  ^.+sessionid= 
<b>([^&#]+)</b>.*$  -   
<i>[E=sessionid:$1]</i>

RewriteRule은 E-플래그를 ([E=sessionid:$1]) 사용하여 sessionid CGI 매개 변수의 현재 값을 변수에 sessionid 지정합니다. RewriteRule $1 의 패턴에서 첫 번째 괄호 집합 사이에 들어 있는 첫 번째 역참조를 참조합니다 ([^&#]+) .
정규 표현식은 ^&#]+ 단어와 다음***& sessionid or #**문자 사이의 URL 부분을 찾습니다. 이 RewriteRule은 세션 ID 변수의 초기 값을 만드는 데만 사용되므로 다시 작성되지 않습니다. 규칙의 대체 필드는 재작성이 필요하지 않음을 - 나타내도록 설정되어 있습니다.
RewriteCond는 변수 sessionid ( %{sessionid} )를 조사합니다. 단 하나의 문자(!.+), 그런 다음 RewriteRule이 일치합니다.
이 규칙을 사용하면 URL이 https://www.domain.com/home/?sessionid=1234&function=start 다음으로 읽히고 변수에 값을 1234 할당합니다 sessionid .
두 번째 규칙은 다음 RewriteRule 패턴과 일치하는 모든 URL을 다시 작성하는 데 사용됩니다.
RewriteRule   
<b>^(.+)</b>sessionid=[^&#]+ 
<i>(.*)$</i>  $1sessionid=%{sessionid}$2

RewriteRule 패턴에는 다음 두 가지 역참조가 포함되어 있습니다. (.+) (.*) Adobe 첫 번째 역참조는 앞에 있는 모든 문자와 일치합니다 sessionid . 두 번째 역참조는 종료 & 또는 종료 후 모든 문자와 일치합니다 # .
대체 패턴은 첫 번째 역참조를 사용하여 URL을 다시 작성하고, 그 다음에 "sessionid=" 문자열이 오고, 첫 번째 규칙에 의해 정의된 세션 ID 변수의 값이 %{sessionid} 뒤에 두 번째 역참조를 사용하여 URL을 다시 작성합니다. ($1sessionid=%{sessionid} $2)
이 RewriteRule에 RewriteCond가 포함되어 있지 않습니다. 따라서 RewriteRule 패턴과 일치하는 모든 URL에 대해 다시 작성하게 됩니다 . 따라서 sessionid 변수( %{sessionid} )의 값이 1234``https://www.domain.com/products/?sessionid=5678&function=buy 이면 양식의 URL이 https://www.domain.com/products/?sessionid=1234&function=buy

감사의 말

다시 작성 엔진 소프트웨어는 원래 Apache Group에서 개발하여 Apache HTTP 서버 프로젝트(https://www.apache.org/)에서 사용할 수 있었습니다.

크롤링 목록 검색 URL 규칙 추가

크롤링 목록 검색 URL 규칙을 추가하여 웹 컨텐츠 내에서 발생한 URL이 재작성되는 방식을 지정할 수 있습니다. 다시 작성 규칙 검색은 URL에 세션 ID와 같은 동적 데이터가 포함되어 있고 동적 데이터가 시간이 경과하여 유효한 상태로 변경되는 경우에만 필요합니다.
크롤링 목록을 추가하려면 URL 규칙 검색
  1. 제품 메뉴에서 > Settings > Rewrite Rules > Crawl List Retrieve URL Rules ​을 클릭합니다.
  2. 필드에 원하는 규칙을 Crawl List Retrieve URL Rules 입력합니다.
    '#'(해시) 문자로 시작하는 빈 줄 및 주석 줄이 허용됩니다.
  3. (선택 사항) Crawl List Retrieve URL Rules 페이지의 Test Crawl List Retrieve URL Rules 필드에 테스트하려는 크롤링 규칙이 있는 테스트 URL을 입력한 다음 테스트를 클릭합니다 .
  4. 변경 내용 저장 ​을 클릭합니다.
  5. (선택 사항) 결과를 미리 보려는 경우 스테이지된 사이트 인덱스를 다시 작성합니다.
    스테이지된 웹 사이트의 증분 인덱스 구성을 참조하십시오.
  6. (선택 사항) Crawl List Retrieve URL Rules 페이지에서 다음 중 하나를 수행합니다.
    • 아이콘을 History 클릭하여 변경한 내용을 되돌립니다.
      작업 내역 옵션 사용을 참조하십시오.
    • 클릭 Live .
      라이브 설정 보기를 참조하십시오.
    • 클릭 Push Live .
      스테이지 설정 라이브를 참조하십시오.

크롤링 제목 규칙 정보

크롤링 제목 규칙은 웹 콘텐츠 내에서 발생하는 제목이 검색 인덱스에 저장되기 전에 어떻게 다시 작성되는지를 지정합니다.
예를 들어 다시 작성 규칙을 사용하여 조직 이름과 같은 제목의 일부를 제거할 수 있습니다. 웹 사이트가 크롤되면 발견된 제목이 임시 버퍼에 저장됩니다. 그러나 이 버퍼에 제목을 추가하기 전에 제목 규칙이 적용됩니다. 기본적으로 사이트 검색/머천다이징에는 크롤링 제목 규칙이 없으며 제목을 수정하지 않습니다.
규칙이 고객에게 미치는 영향을 보기 전에 사이트 인덱스를 다시 작성하십시오.
기록 기능을 사용하여 제목 규칙 크롤링(Crawing Title) 규칙에 대한 변경 사항을 신속하게 되돌릴 수 있습니다.
규칙은 다음 두 가지 주요 요소로 구성됩니다.rewriteRule 및 선택적 RewriteCond를 사용합니다. 규칙 및 조건 수를 제한 없이 지정할 수 있습니다. 규칙 세트는 규칙별로 반복되므로 이러한 규칙의 순서가 중요합니다. 규칙이 일치하면 해당하는 모든(선택 사항) 다시 작성 조건을 반복합니다. 크롤링 URL 규칙은 다음과 같은 방법으로 지정됩니다.
RewriteCond  
<i>TestString CondPattern [Flags]</i> 
RewriteRule  
<i>Pattern Substitution [Flags]</i> 
 
RewriteCond  
<i>TestString CondPattern [Flags]</i> 
RewriteRule  
<i>Pattern Substitution [Flags]</i>

제목이 발견되면 검색 로봇은 제목을 각 크롤링 규칙의 패턴과 일치시킵니다. 패턴이 일치하는 경우 다시 작성 엔진은 해당 RewriteCond 지시문을 찾습니다. 조건이 없는 경우 URL은 대체 문자열에서 생성된 새 값으로 대체되고 규칙 세트의 다음 규칙으로 계속됩니다. 조건이 있으면 나열된 순서대로 처리됩니다. 다시 작성 엔진은 테스트 문자열(TestString)과 조건 패턴(CondPattern)을 일치시키려고 합니다. 두 일치 조건이 있으면 사용 가능한 조건이 없을 때까지 다음 조건이 처리됩니다. 모든 조건이 일치하는 경우 URL은 규칙에 지정된 대체로 대체됩니다. 조건이 충족되지 않으면 전체 조건 세트와 해당 규칙이 실패합니다.
텍스트 상자에 URL 규칙 크롤링을 입력한 다음 변경 내용 저장을 클릭합니다. '#'(해시) 문자로 시작하는 빈 줄 및 주석 줄이 허용됩니다. 검색 규칙을 테스트하려면 "테스트 다시 작성 규칙" 텍스트 상자에 테스트 URL을 입력한 다음 테스트를 클릭합니다.

RewriteRule 지시문

각 RewriteRule 지시문은 재작성 규칙 하나를 정의합니다. 규칙은 나열된 순서대로 적용됩니다. 다시 작성 규칙은 다음 양식을 사용합니다.
RewriteRule Pattern Substitution [Flags]

패턴은 현재 제목에 적용되는 POSIX 정규 표현식일 수 있습니다. 이전 규칙이 이미 일치하고 변경되었으므로 "현재 제목"은 원래 제목과 다릅니다.
"not" 문자('!')를 사용할 수 있습니다. 에 접두사를 붙입니다. "not" 문자를 사용하면 패턴을 무효화할 수 있습니다. 즉, 현재 제목이 패턴과 일치하지 않는 경우에만 true입니다. "not" 문자는 네거티브 패턴과 일치하거나 최종 기본 규칙으로 사용할 수 있습니다. 참고:"not" 문자와 그룹화된 와일드카드를 모두 패턴에 사용할 수 없습니다. 또한 대체 문자열에 $N이 들어 있는 경우 무효화된 패턴을 사용할 수 없습니다.
괄호를 사용하여 대체를 만들고 CondPattern에서 참조할 수 있는 역참조를 만들 수 있습니다.
대체 제목은 대체 문자열로 대체됩니다. 문자열에는 다음이 포함될 수 있습니다.
일반 텍스트 - 변경되지 않고 전달된 텍스트입니다.
역참조를 사용하면 Pattern 또는 CondPattern의 그룹화된 부품(괄호 안)에 액세스할 수 있습니다. 다음은 두 가지 유형의 역참조입니다.
  • 다시 작성 규칙 역참조
    이러한 일치 백참조는 해당 RewriteRule 패턴에 있고 $N(0 <= N <= 9) 형식을 사용합니다. 예, RewriteRule ^My[[:blank:]] (.*)$ ${toupper: $1}
  • 다시 쓰기 컨텍스트 역참조
    마지막으로 일치된 RewriteCond ContextPattern의 이러한 일치 역참조와 %N(0 <= N <= 9) 형식을 사용합니다.
변수 % 형식의 변수입니다. 여기서 NAME_OF_VARIABLE은 정의된 변수의 이름에 대한 문자열이 될 수 있습니다. 환경 변수 설정에 대한 자세한 내용은 [E] 플래그를 참조하십시오.
함수 ${NAME_OF_FUNCTION 형식의 함수입니다.key} 여기서 NAME_OF_FUNCTION은 다음과 같습니다.
  • Tolower는 소문자에서 모든 문자를 만듭니다.
  • toupper는 모든 문자를 대문자로 만듭니다.
특수 대체 문자열이 있습니다.'-'는 "대체가 없습니다"를 의미합니다. '-' 문자열은 종종 C(체인) 플래그에 유용하므로 대체가 발생하기 전에 제목을 여러 패턴과 일치시킬 수 있습니다.
플래그 (선택 사항)
플래그는 대괄호로 [] 묶이고 여러 플래그는 쉼표로 구분됩니다.
플래그
설명
'last|L'
마지막 규칙.
다시 작성 프로세스를 중지하고 추가 재작성 규칙을 적용하지 않습니다. 현재 제목에 대한 추가 처리가 되지 않도록 하려면 이 플래그를 사용합니다.
'next|N'
다음 단계
원래 제목이 아닌 마지막 재작성 규칙의 제목을 사용하여 재작성 프로세스(첫 번째 재작성 규칙으로 다시 시작)를 다시 실행합니다. 막다른 고리를 만들지 않도록 주의해라.
'chain|C'
다음 규칙과 연계되어 있습니다.
현재 규칙을 다음 규칙에 체인으로 연결(다음 규칙에 체인으로 연결할 수도 있음) 규칙이 일치하면 대체 프로세스가 평소대로 계속됩니다. 규칙이 일치하지 않으면 이후의 모든 체인 규칙을 건너뜁니다.
'nocase|NC'
케이스 없이
패턴이 현재 제목과 일치할 때 패턴의 대/소문자를 구분하지 않도록 합니다(즉, 'A-Z'와 'a-z' 사이에 차이가 없습니다).
'skip|S=num'
다음 규칙 또는 규칙을 건너뜁니다.
현재 규칙이 일치하는 경우 이 플래그는 다시 작성 엔진을 강제로 규칙 세트의 다음 num 규칙을 건너뜁니다. 이를 사용하여 의사 if-then-else 구문을 만듭니다. then-절의 마지막 규칙은 skip=N이 됩니다. 여기서 N은 else-절의 규칙 수입니다. (참고:이것은 'chain|C' 플래그와 같지 않습니다.)
'env|E=VAR:VAL'
환경 변수를 설정합니다.
값 VAL에 설정된 환경 변수 "VAR"를 만듭니다. 여기서 VAL은 확장되는 정규 표현식 역참조, $N 및 %N을 포함할 수 있습니다. 이 플래그를 두 번 이상 사용하여 여러 변수를 설정할 수 있습니다. 이 변수는 나중에 %{VAR}을(를) 통해 다음 RewriteCond 패턴에서 참조할 수 있습니다. 이 플래그를 사용하여 제목에서 정보를 제거하고 기억하십시오.

RewriteCond 지시문(선택 사항)

RewriteCond 지시문은 규칙 조건을 정의합니다. RewriteCond가 RewriteRule 앞에 있으면 해당 패턴이 현재 제목과 일치하고 추가 조건이 적용되는 경우에만 규칙이 사용됩니다.
다시 작성 조건 지시문은 다음 양식을 사용합니다.
RewriteCond TestString CondPattern [Flags] 

TestString 은 다음 구문을 포함할 수 있는 문자열입니다.
일반 텍스트 - 변경되지 않고 전달된 텍스트입니다.
역참조를 사용하면 Pattern 또는 CondPattern의 그룹화된 부품(괄호 안)에 액세스할 수 있습니다. 다음과 같은 두 가지 유형의 역참조가 있습니다.
  • RewriteRule Backreferences 해당 RewriteRule 패턴에서 이러한 일치 역참조를 사용하고 $N(0 <= N <= 9) 형식을 사용합니다. 예, RewriteRule ^My[[:blank:]] (.*)$ ${toupper: $1}
  • RewriteCond 역참조 마지막 일치 RewriteCondPattern에서 이러한 일치 역참조를 사용하고 %N(0 <= N <= 9) 형식을 사용합니다.
변수 % 형식의 변수입니다. 여기서 NAME_OF_VARIABLE은 정의된 변수의 이름에 대한 문자열이 될 수 있습니다. 환경 변수 설정에 대한 자세한 내용은 [E] 플래그를 참조하십시오.
함수 $ 형식의 함수입니다. 여기서 NAME_OF_FUNCTION은 다음과 같습니다.
  • Tolower는 소문자에서 모든 문자를 만듭니다.
  • toupper는 모든 문자를 대문자로 만듭니다.
  • escape URL은 키의 모든 문자를 인코딩합니다.
  • 'a'..'z', 'A'.'Z', '0'..'9', '*', '-', '.', '/', '@' 및 '_'는 변경되지 않고 그대로 유지되고 공백은 '+'로 변환되며 다른 모든 문자는 %xx URL 인코딩된 상응하는 문자로 변환됩니다.
  • escape는 '+'를 다시 공백으로 변환하고 모든 %xx URL 인코딩 문자를 다시 단일 문자로 변환합니다.
CondPattern 은 일부 추가가 있는 표준 확장 정규 표현식입니다. 패턴 문자열 앞에 '!'를 추가할 수 있습니다. 문자(느낌표)를 사용하여 일치하지 않는 패턴을 지정합니다. 실제 정규 표현식 문자열 대신 다음 특수 변형 중 하나를 사용할 수 있습니다.
이러한 모든 테스트에 느낌표('!')를 접두사로 사용할 수 있습니다. 그들의 의미를 무시하다.
CondPattern 문자열
설명
'<CondPattern'
어휘가 적습니다.
CondPattern 일반 문자열로 취급하여 TestString과 사전적으로 비교합니다 . TestString CondPattern보다 사전적으로 작으면 true입니다 .
'>CondPattern'
보다 풍부합니다.
CondPattern 일반 문자열로 취급하여 TestString과 사전적으로 비교합니다 . TestString CondPattern보다 사전적으로 큰 경우 True입니다 .
'=CondPattern'
사전적으로 동일한
CondPattern 일반 문자열로 취급하여 TestString과 사전적으로 비교합니다 . TestString CondPattern과 사전적으로 같으면 true입니다. 즉, 두 문자열은 정확히 동일한(문자별)입니다. ContextPattern 단지 ""(두 따옴표)일 경우 TestString 빈 문자열로 비교합니다.
플래그 (선택 사항)
플래그는 대괄호로 [] 묶이고 여러 플래그는 쉼표로 구분됩니다.
플래그
설명
'nocase|NC'
케이스 없이
테스트를 민감하지 않게 합니다. 즉, 확장된 TestString과 CondPattern에서 'A-Z'와 'a-z' 모두 차이가없습니다.
'ornext|OR'
다음 상태
이 플래그를 사용하여 규칙 조건을 암시적 AND 대신 로컬 OR과 결합합니다. 이 플래그가 없으면, 콘드/규칙을 여러 번 작성해야 합니다.
표준 제목 형식이 있는 회사 웹 사이트가 있다고 가정합니다."My Company" 뒤에 하이픈이 표시된 다음 페이지별 설명("My Company - Welcome" 또는 "My Company - News" 등)이 옵니다. 제목에서 "My Company -"를 제거하고 사이트를 인덱싱할 때 전체 제목을 대문자로 변환하려고 합니다.
다음 다시 작성 규칙은 함수 터퍼를 사용하여 제목의 설명적인 부분만 대문자로 다시 씁니다.
RewriteRule  ^My[[:blank:]]Company[[:blank:]]-[[:blank:]] 
<b>(.*)</b>$  ${toupper: 
<b>$1</b>}

규칙의 패턴에는 "내 회사" 다음에 나오는 제목 내용과 (^My[[:blank:]]Company[[:blank:]]-[[:blank:]] (.*)) 일치하는 역참조가 (.*) 포함되어 있습니다. 괄호()를 사용하여 패턴의 일부를 둘러싸면 대체에 의해 참조할 수 있는 역참조가 만들어진다는 점을 기억하십시오. 이 예에서 대체(${toupper: $1 })는 터치퍼 함수를 사용하여 해당 역참조( $1 )를 다시 씁니다.
따라서 "My Company - Welcome" 형식의 제목은 "WELCOME"으로 다시 작성되었습니다.
감사의 말
다시 작성 엔진 소프트웨어는 원래 Apache Group에서 개발하여 Apache HTTP 서버 프로젝트(https://www.apache.org/)에서 사용할 수 있었습니다.

크롤링 제목 규칙 추가

크롤링 제목 규칙을 추가하여 웹 콘텐츠 내에서 발생하는 제목이 검색 인덱스에 저장되기 전에 어떻게 다시 작성되는지 지정할 수 있습니다.
크롤링 제목 규칙을 추가하려면
  1. 제품 메뉴에서 > Settings > Rewrite Rules > Crawl Title Rules ​을 클릭합니다.
  2. 필드에 원하는 규칙을 Crawl Title Rules 입력합니다.
    '#'(해시) 문자로 시작하는 빈 줄 및 주석 줄이 허용됩니다.
  3. (선택 사항) Crawl Title Rules 페이지의 Test Crawl Title Rules 필드에 테스트하려는 검색 규칙이 있는 테스트 URL을 입력한 다음 테스트를 클릭합니다 .
  4. 변경 내용 저장 ​을 클릭합니다.
  5. (선택 사항) 결과를 미리 보려는 경우 스테이지된 사이트 인덱스를 다시 작성합니다.
    스테이지된 웹 사이트의 증분 인덱스 구성을 참조하십시오.
  6. (선택 사항) Crawl Title Rules 페이지에서 다음 중 하나를 수행합니다.
    • 아이콘을 History 클릭하여 변경한 내용을 되돌립니다.
      작업 내역 옵션 사용을 참조하십시오.
    • 클릭 Live .
      라이브 설정 보기를 참조하십시오.
    • 클릭 Push Live .
      스테이지 설정 라이브를 참조하십시오.

검색 URL 규칙 정보

검색 URL 규칙은 웹 사이트 검색 결과의 URL이 표시되는 방식을 지정합니다. 규칙은 전체 URL에서 작동합니다. 세션 ID 정보가 자주 보관되는 쿼리 인수를 포함하여 URL의 모든 부분을 조작할 수 있습니다.
일반적으로 검색 URL 규칙은 세션 ID를 URL에 삽입하는 데 사용됩니다. 그러나 검색 URL 규칙을 사용하여 결과와 함께 표시되는 도메인 이름을 변경할 수도 있습니다. 기본적으로 규칙은 지정되지 않으며 URL 수정이 수행되지 않습니다.
검색 URL 규칙은 다음 두 가지 기본 요소로 구성될 수 있습니다.rewriteRule 및 선택적 RewriteCond를 사용합니다. URL이 검색 결과의 일부로 포함되는 경우 규칙을 조작하는 데 사용됩니다. 검색 URL 규칙 및 조건 수를 제한 없이 지정할 수 있습니다. 규칙 세트는 규칙별로 반복되므로 이러한 규칙의 순서가 중요합니다. 규칙이 일치하면 소프트웨어는 해당하는 모든(선택 사항) 다시 작성 조건을 반복합니다. 크롤링 URL 규칙은 다음과 같은 방법으로 지정됩니다.
RewriteCond  
<i>TestString CondPattern [Flags]</i> 
RewriteRule  
<i>Pattern Substitution [Flags]</i> 
 
RewriteCond  
<i>TestString CondPattern [Flags]</i> 
RewriteRule  
<i>Pattern Substitution [Flags]</i>

URL을 처리할 때 사이트 검색/머천다이징은 이를 각 검색 규칙의 패턴과 일치시키려고 합니다. 일치에 실패하면 다시 작성 엔진은 규칙 처리를 즉시 중지하고 세트의 다음 규칙으로 계속합니다. 패턴이 일치하는 경우 다시 작성 엔진은 해당 RewriteCond 지침을 찾습니다. 조건이 없으면 URL은 새 값으로 대체됩니다. 이 값은 대체 문자열에서 생성되며 규칙 세트의 다음 규칙과 함께 계속됩니다. 조건이 있는 경우 나열되는 순서는 처리 방법입니다. 다시 작성 엔진은 테스트 문자열(TestString)과 조건 패턴(CondPattern)을 일치시키려고 합니다. 두 일치 조건이 있으면 사용 가능한 조건이 없을 때까지 다음 조건이 처리됩니다. 모든 조건이 일치하면 URL이 규칙에 지정된 대체로 대체됩니다. 조건이 충족되지 않으면 전체 조건 세트와 해당 규칙이 실패합니다.

RewriteRule 지시문 정보

다시 작성 규칙은 다음 양식을 사용합니다.
RewriteRule  
<i>Pattern Substitution [Flags]</i>

패턴은 현재 URL에 적용되는 POSIX 정규 표현식이 될 수 있습니다. "현재 URL"은 이전 규칙이 이미 일치하여 변경되었을 수 있으므로 원래 URL과 다를 수 있습니다.
"not" 문자('!')를 사용할 수 있습니다. 에 접두사를 붙입니다. "not" 문자를 사용하면 패턴을 무효화할 수 있습니다. 즉, 현재 URL이 패턴과 일치하지 않는 경우에만 적용됩니다. 네거티브 패턴이나 최종 기본 규칙으로 일치시키는 것이 더 좋은 경우 "not" 문자를 사용할 수 있습니다. "not" 문자와 그룹화된 와일드카드를 모두 패턴에 사용할 수는 없습니다. 또한 대체 문자열에 $N이 들어 있는 경우 무효화된 패턴을 사용할 수 없습니다.
괄호를 사용하여 대체를 만들고 CondPattern에서 참조할 수 있는 역참조를 만들 수 있습니다.
대체 URL은 다음을 포함할 수 있는 대체 문자열로 완전히 대체됩니다.
일반 텍스트 - 변경되지 않고 전달된 텍스트입니다.
역참조 패턴 또는 CondPattern의 그룹화된 부품(괄호 내부)에 액세스할 수 있습니다. 다음과 같은 두 가지 유형의 역참조가 있습니다.
RewriteRule Backreferences 해당 RewriteRule 패턴에서 이러한 일치 역참조를 사용하고 $N(0 <= N <= 9) 형식을 사용합니다. 예, RewriteRule ^My[[:blank:]] (.*)$ ${toupper: $1}
RewriteCond 역참조 - 마지막으로 일치된 RewriteCondPattern의 이러한 일치 역참조를 사용하고 %N(0 <= N <= 9) 형식을 사용합니다.
함수:$ 형식의 함수입니다. 여기서 NAME_OF_FUNCTION은 다음과 같습니다.
  • Tolower는 소문자에서 모든 문자를 만듭니다.
  • toupper는 모든 문자를 대문자로 만듭니다.
  • escape URL은 키의 ​모든 문자를 인코딩합니다.
  • 'a'..'z', 'A'.'Z', '0'..'9', '*', '-', '.', '/', '@' 및 '_'는 변경되지 않았습니다.공백은 '+'로 변환됩니다.다른 모든 문자는 %xx URL 인코딩된 상응하는 문자로 변환됩니다.
  • escape는 '+'를 다시 공백으로 변환하고 모든 %xx URL 인코딩 문자를 다시 단일 문자로 변환합니다.
특수 대체 문자열이 있습니다.'-'는 "대체가 없습니다"를 의미합니다. '-' 문자열은 종종 C(체인) 플래그와 함께 유용합니다. 대체를 하기 전에 URL을 여러 패턴과 일치시킬 수 있습니다.
플래그 (선택 사항)
플래그는 대괄호로 [] 묶이고 여러 플래그는 쉼표로 구분됩니다.
플래그
설명
'last|L'
마지막 규칙.
다시 작성 프로세스를 중지하고 추가 재작성 규칙을 적용하지 않습니다. 현재 URL에 대한 추가 처리를 방지하려면 이 플래그를 사용합니다.
'next|N'
다음 단계
첫 번째 다시 작성 규칙으로 다시 시작하여 마지막 다시 작성 규칙의 URL을 사용하여 다시 작성 프로세스를 실행합니다(원래 URL이 아님). 죽은 루프를 만들지 않도록 조심해!
'chain|C'
다음 규칙과 연계되어 있습니다.
이 플래그는 현재 규칙을 다음 규칙에 연결하며, 다음 규칙에 연결할 수도 있습니다. 규칙이 일치하면 대체 프로세스가 평소대로 계속됩니다. 규칙이 일치하지 않으면 이후의 모든 체인 규칙을 건너뜁니다.
'nocase|NC'
케이스 없이
이 플래그로 인해 패턴 대/소문자를 구분하지 않습니다. 즉, 현재 URL과 패턴이 일치하면 'A-Z'와 'a-z'는 아무런 차이가 없습니다.
'skip|S=num'
다음 규칙 또는 규칙을 건너뜁니다.
현재 규칙이 일치하는 경우 이 플래그는 다시 작성 엔진을 강제로 규칙 세트의 다음 num 규칙을 건너뜁니다. 이를 사용하여 의사 if-then-else 구문을 만듭니다. then-절의 마지막 규칙은 skip=N이 됩니다. 여기서 N은 else-절의 규칙 수입니다. (참고:이것은 'chain|C' 플래그와 같지 않습니다.)
'env|E=VAR:VAL'
환경 변수를 설정합니다.
이 플래그는 VAL 값으로 설정된 환경 변수 "VAR"를 만듭니다. VAL에는 확장되는 정규 표현식 역참조, $N 및 %N이 포함될 수 있습니다. 이 플래그를 두 번 이상 사용하여 여러 변수를 설정할 수 있습니다. 이 변수는 나중에 %{VAR}을(를) 통해 다음 RewriteCond 패턴에서 역참조될 수 있습니다. 이 플래그를 사용하여 URL의 정보를 제거하고 기억하십시오.
저장소 다시 작성 규칙 및 다시 작성 규칙 검색은 변수 값을 공유합니다. 이로 인해 포함된 URL이 발견되어 저장될 때 변수를 시간 구분 세션 ID 값으로 설정할 수 있습니다. 임시 저장소 목록에서 다음 URL을 검색할 때 해당 페이지를 검색하기 전에 최신 세션 ID 값을 추가할 수 있습니다.
대소문자를 구분하는 서버가 있다고 가정해 보십시오. 문자열 "www.mydomain.com" 및 "www.MyDomain.com"을 다르게 처리합니다. 서버가 올바르게 작동하려면 일부 문서에 "www.MyDomain.com"을 참조하는 링크가 포함되어 있더라도 도메인이 항상 "www.mydomain.com"인지 확인해야 합니다. 이렇게 하려면 다음 규칙을 사용할 수 있습니다.
RewriteRule  ^https:// 
<b>([^/]*)</b> 
<i>(.*)</i>$  https://${tolower:$1}$2 

이 다시 작성 규칙은 "도구" 함수를 사용하여 URL의 도메인 부분을 다시 작성하여 항상 소문자가 되도록 합니다.
  1. 패턴에는 URL의 "https://"과 첫 번째 "/" 사이의 모든 문자와 일치하는 역참조가 (^https://([^/]*)(.*)$) ([^/]*) 포함되어 있습니다. 패턴에는 두 번째 역참조 (.*) URL의 나머지 모든 문자와 일치하는 항목을 찾습니다.
  2. 대체 (https://${tolower:$1}$2) 기능은 검색 엔진에서 첫 번째 역참조에서 도구 함수를 사용하여 URL의 나머지 부분은 (https://**${tolower:$1**}$2) 그대로 남겨 두도록 지시합니다 (https://${tolower:$1}*$2*) .
따라서 양식의 URL은 https://www.MyDomain.com/INTRO/index.Html``https://www.mydomain.com/INTRO/index.Html
RewriteCond 지시문 (선택 사항)
RewriteCond 지시문은 규칙 조건을 정의합니다. RewriteCond가 RewriteRule 앞에 있으면 해당 패턴이 현재 제목과 일치하고 추가 조건이 적용되는 경우에만 규칙이 사용됩니다.
다시 작성 조건 지시문은 다음 양식을 사용합니다.
RewriteCond  
<i>TestString CondPattern [Flags]</i>

TestString 은 다음 구문을 포함할 수 있는 문자열입니다.
일반 텍스트:변경되지 않은 상태로 전달된 텍스트입니다.
역참조를 사용하면 Pattern 또는 CondPattern의 그룹화된 부품(괄호 안)에 액세스할 수 있습니다. 다음과 같은 두 가지 유형의 역참조가 있습니다.
  • ** RewriteRule Backreferences** 해당 RewriteRule 패턴에 있는 이러한 일치 역참조를 사용하고 $N(0 <= N <= 9) 형식을 사용합니다. 예, RewriteRule ^My[[:blank:]] (.*)$ ${toupper: $1}
  • RewriteCond 역참조 마지막 일치 RewriteCondPattern에서 이러한 일치 역참조를 사용하고 %N(0 <= N <= 9) 형식을 사용합니다.
변수 % 형식의 변수입니다. 여기서 NAME_OF_VARIABLE은 정의된 변수의 이름에 대한 문자열이 될 수 있습니다. 변수 설정에 대한 자세한 내용은 RewriteRule [E] 플래그를 참조하십시오.
재작성 규칙은 일반적으로 변수를 사용합니다. 현재 URL의 모든 CGI 매개 변수가 자동으로 변수로 만들어집니다. 예를 들어, 검색 URL은 자동으로 네 개의 변수를 "https://search.atomz.com/search/?sp_a=sp00000000&sp_q="Product"&session=1234&id=5678" 제공하며 이 변수는 다시 작성 규칙에서 참조할 수 있습니다. 이 예에서, 하나의 변수는 "session"이고, 그 값은 "1234"이고, 다른 변수는 "id"이고, 그 값은 "5678"입니다. 다른 두 변수는 sp_a sp_q 입니다. 웹 페이지의 검색 양식에서 필요한 모든 변수를 숨김 필드로 전달해야 합니다. 이 예에서는 검색을 수행하는 웹 사이트 사용자를 식별하는 "session" 및 "id" 값을 전달해야 합니다. 검색 양식에서 숨김 필드를 전달하려면 같은 태그를 <input type=hidden name="session" value="1234"> 사용합니다.
함수 $ 형식의 함수입니다. 여기서 NAME_OF_FUNCTION은 다음과 같습니다.
  • Tolower는 소문자에서 모든 문자를 만듭니다.
  • toupper는 모든 문자를 대문자로 만듭니다.
  • escape URL은 키의 ​모든 문자를 인코딩합니다. 'a'..'z', 'A'.'Z', '0'..'9', '*', '-', '.', '/', '@' 및 '_'는 변경되지 않고 그대로 유지되고 공백은 '+'로 변환되며 다른 모든 문자는 %xx URL 인코딩된 상응하는 문자로 변환됩니다.
  • escape는 '+'를 다시 공백으로 변환하고 모든 %xx URL은 문자를 다시 단일 문자로 인코딩합니다.
CondPattern 은 일부 추가가 있는 표준 확장 정규 표현식입니다. 패턴 문자열 앞에 '!'를 추가할 수 있습니다. 문자(느낌표)를 사용하여 일치하지 않는 패턴을 지정합니다. 실제 정규 표현식 문자열 대신 다음 특수 변형 중 하나를 사용할 수 있습니다.
느낌표('!')를 사용하여 이러한 모든 테스트에 접두사를 지정할 수 있습니다. 그들의 의미를 무시하다.
CondPattern 문자열
설명
'<CondPattern'
어휘가 적습니다.
CondPattern 일반 문자열로 취급하여 TestString과 사전적으로 비교합니다 . TestString CondPattern보다 사전적으로 작으면 true입니다 .
'>CondPattern'
보다 풍부합니다.
CondPattern 일반 문자열로 취급하여 TestString과 사전적으로 비교합니다 . TestString CondPattern보다 사전적으로 큰 경우 True입니다 .
'=CondPattern'
사전적으로 동일한
CondPattern 일반 문자열로 취급하여 TestString과 비교합니다 . TestString CondPattern과 사전적으로 같으면 True입니다 . 즉, 두 문자열은 정확하게 동일합니다(문자별로). ContextPattern 단지 ""(두 따옴표)일 경우 TestString 빈 문자열로 비교합니다.
플래그 (선택 사항)
플래그는 대괄호로 [] 묶이고 여러 플래그는 쉼표로 구분됩니다.
'nocase|NC'(대/소문자 없음):이렇게 하면 테스트 대/소문자를 구분하지 않습니다. 즉, 확장된 TestString과 CondPattern에서 'A-Z'와 'a-z' 모두 차이가 ​없습니다.
'ornext|OR'(또는 다음 조건):규칙 조건을 암시적 AND 대신 로컬 OR과 결합하려면 이 옵션을 사용합니다. 이 플래그가 없으면 콘드/규칙을 여러 번 작성해야 합니다.
일부 웹 페이지는 고객이 사이트에 처음 도착할 때 "sessionid" CGI 변수를 할당합니다. 이 변수는 고객을 식별하는 데 사용되며 고객이 사이트를 탐색할 때 변수가 전달됩니다. 검색 로봇이 사이트의 고객처럼 보이기 때문에 "sessionid" 번호가 할당됩니다. 검색 로봇은 두 번째 사이트 페이지에서 새 값을 지정하려고 해도 이 단일 "sessionid" 값을 유지합니다. 이를 위해서는 다음 다시 작성 규칙이 필요합니다.
RewriteCond  %{sessionid}  .+ 
RewriteRule  ^ 
<b>(.+)</b>sessionid=[^&#]+ 
<i>(.*)</i>$   
<b>$1</b>sessionid=%{sessionid} 
<i>$2</i>

RewriteRule 패턴에는 다음 두 가지 역참조가 포함되어 있습니다.(.+) 및 (.*). 첫 번째 역참조는 "sessionid=" 앞에 있는 모든 문자와 일치합니다. 두 번째 역참조는 세션 ID의 종료 '&' 또는 '#' 뒤에 오는 모든 문자와 일치합니다.
대체 패턴은 첫 번째 역참조를 사용하여 URL을 다시 작성하고, 그 다음에 "sessionid=" 문자열을, URL에서 CGI 매개 변수로 전달된 세션 ID 변수 값을 차례로 반환합니다. ($1sessionid=%{sessionid}$2) Adobe
RewriteCond 변수 sessionid를 검사합니다 (%{sessionid}) . 하나 이상의 문자(.+), 그런 다음 RewriteRule이 일치합니다.
따라서 검색 쿼리가 "https://search.atomz.com/search/?sp_a=sp99999999&sp_q=word&sessionid=5678" 있는 경우 검색 로봇이 사이트를 크롤링하고 링크를 저장할 때 발생하는 "sessionid" 값 대신 "sessionid" 값이 "5678"이 되도록 모든 검색 결과 URL이 다시 작성됩니다.
감사의 말
다시 작성 엔진 소프트웨어는 원래 Apache Group에서 개발하여 Apache HTTP 서버 프로젝트(https://www.apache.org/)에서 사용할 수 있었습니다.

검색 URL 규칙 추가

검색 URL 규칙을 추가하여 웹 사이트 검색 결과의 URL이 표시되는 방식을 지정할 수 있습니다. 규칙은 전체 URL에서 작동합니다. 세션 ID 정보가 자주 보관되는 쿼리 인수를 포함하여 URL의 모든 부분을 조작할 수 있습니다.
검색 URL 규칙을 추가하려면
  1. 제품 메뉴에서 > Settings > Rewrite Rules > Search URL Rules ​을 클릭합니다.
  2. 필드에 원하는 규칙을 Search URL Rules 입력합니다.
    '#'(해시) 문자로 시작하는 빈 줄 및 주석 줄이 허용됩니다.
  3. (선택 사항) Search URL Rules 페이지의 Test Search URL Rules 필드에 테스트하려는 크롤링 규칙이 있는 테스트 URL을 입력한 다음 테스트를 클릭합니다 .
  4. 변경 내용 저장 ​을 클릭합니다.
  5. (선택 사항) 결과를 미리 보려는 경우 스테이지된 사이트 인덱스를 다시 작성합니다.
    스테이지된 웹 사이트의 증분 인덱스 구성을 참조하십시오.
  6. (선택 사항) Search URL Rules 페이지에서 다음 중 하나를 수행합니다.
    • 아이콘을 History 클릭하여 변경한 내용을 되돌립니다.
      작업 내역 옵션 사용을 참조하십시오.
    • 클릭 Live .
      라이브 설정 보기를 참조하십시오.
    • 클릭 Push Live .
      스테이지 설정 라이브를 참조하십시오.

검색 제목 규칙 정보

검색 제목 규칙은 웹 사이트 검색 결과의 제목 표시 방법을 지정합니다. 제목의 모든 부분을 조작할 수 있습니다.
다시 작성 규칙은 조직 이름과 같이 제목의 부분을 제거하는 데 사용할 수 있습니다. 기본적으로 사이트 검색/머천다이징에는 제목 규칙이 없으며 제목을 수정하지 않습니다.
제목 규칙은 두 가지 기본 요소로 구성될 수 있습니다.rewriteRule 및 선택적 RewriteCond입니다. 규칙 및 조건을 제한 없이 지정할 수 있습니다. 규칙 세트는 규칙별로 반복되므로 이러한 규칙의 순서가 중요합니다. 규칙이 일치하면 소프트웨어는 해당하는 모든(선택 사항) 다시 작성 조건을 반복합니다. 검색 제목 규칙은 다음과 같은 방식으로 지정됩니다.
RewriteCond  
<i>TestString CondPattern [Flags]</i> 
RewriteRule  
<i>Pattern Substitution [Flags]</i> 
 
RewriteCond  
<i>TestString CondPattern [Flags]</i> 
RewriteRule  
<i>Pattern Substitution [Flags]</i>

제목이 발견되면 사이트 검색/머천다이징이 각 크롤링 규칙의 패턴과 일치시키려고 합니다. 패턴이 일치하는 경우 다시 작성 엔진은 해당 RewriteCond 지시문을 찾습니다. 조건이 없는 경우 제목은 대체 문자열에서 생성된 새 값으로 대체되며 규칙 세트의 다음 규칙으로 계속됩니다. 조건이 있으면 나열된 순서대로 처리됩니다. 다시 작성 엔진은 테스트 문자열(TestString)과 조건 패턴(CondPattern)을 일치시키려고 합니다. 두 일치 조건이 있으면 사용 가능한 조건이 없을 때까지 다음 조건이 처리됩니다. 모든 조건이 일치하면 URL이 규칙에 지정된 대체로 대체됩니다. 조건이 충족되지 않으면 전체 조건 세트와 해당 규칙이 실패합니다.

RewriteRule 지시문

각 RewriteRule 지시문은 재작성 규칙 하나를 정의합니다. 규칙은 나열된 순서대로 적용됩니다. 다시 작성 규칙은 다음 양식을 사용합니다.
RewriteRule Pattern Substitution [Flags]

패턴 현재 제목에 적용되는 POSIX 정규 표현식. 이전 규칙이 이미 일치하여 변경되었을 수 있으므로 "현재 제목"은 원래 제목과 다를 수 있습니다.
"not" 문자('!')를 사용할 수 있습니다. 에 접두사를 붙입니다. "not" 문자를 사용하면 패턴을 무효화할 수 있습니다. 즉, 현재 제목이 패턴과 일치하지 않는 경우에만 true입니다. "not" 문자는 네거티브 패턴과 일치하거나 최종 기본 규칙으로 사용할 수 있습니다. 참고:"not" 문자와 그룹화된 와일드카드를 모두 패턴에 사용할 수 없습니다. 또한 대체 문자열에 $N이 들어 있는 경우 무효화된 패턴을 사용할 수 없습니다.
괄호를 사용하여 대체를 만들고 CondPattern에서 참조할 수 있는 역참조를 만들 수 있습니다.
대체 제목은 다음을 포함할 수 있는 대체 문자열로 완전히 대체됩니다.
일반 텍스트 - 변경되지 않고 전달된 텍스트입니다.
역참조 Pattern 또는 CondPattern의 그룹화된 부품(내부 괄호)에 액세스할 수 있습니다. 다음은 두 가지 유형의 역참조입니다.
  • RewriteRule Backreferences 해당 RewriteRule 패턴의 이러한 일치 역참조를 사용하고 $N(0 <= N <= 9) 형식을 사용합니다. 예, RewriteRule ^My[[:blank:]] (.*)$ ${toupper: $1}
  • ** RewriteCond 역참조** 마지막 일치 RewriteCondPattern에서 이러한 일치 역참조를 사용하고 %N(0 <= N <= 9) 형식을 사용합니다.
변수 % 형식의 변수입니다. 여기서 NAME_OF_VARIABLE은 정의된 변수의 이름에 대한 문자열이 될 수 있습니다. 환경 # 대한 자세한 내용은 E 플래그를 참조하십시오. 검색 결과를 생성한 검색 양식에서 변수를 정의할 수도 있습니다.
함수 ${NAME_OF_FUNCTION 형식의 함수입니다.key} 여기서 NAME_OF_FUNCTION은 다음과 같습니다.
  • Tolower는 소문자에서 모든 문자를 만듭니다.
  • toupper는 모든 문자를 대문자로 만듭니다.
특수 대체 문자열이 있습니다.'-'는 "대체가 없습니다"를 의미합니다. '-' 문자열은 종종 C(체인) 플래그와 함께 유용하므로 대체를 하기 전에 제목을 여러 패턴과 일치시킬 수 있습니다.
플래그 (선택 사항)
플래그는 대괄호로 [] 묶이고 여러 플래그는 쉼표로 구분됩니다.
플래그
설명
'last|L'
마지막 규칙.
다시 작성 프로세스를 중지하고 추가 재작성 규칙을 적용하지 않습니다. 현재 제목에 대한 추가 처리가 되지 않도록 하려면 이 플래그를 사용합니다.
'next|N'
다음 단계
마지막 재작성 규칙의 제목을 사용하여(원래 제목이 아닌) 재작성 프로세스를 다시 실행합니다(첫 번째 재작성 규칙으로 다시 시작). 막다른 고리를 만들지 않도록 주의해라.
'chain|C'
다음 규칙과 연계되어 있습니다.
이 플래그는 현재 규칙을 다음 규칙에 연결(다음 규칙에 연결할 수도 있음)합니다. 규칙이 일치하면 대체 프로세스가 평소대로 계속됩니다. 규칙이 일치하지 않으면 이후의 모든 체인 규칙을 건너뜁니다.
'nocase|NC'
케이스 없이
이 플래그로 인해 패턴 대/소문자를 구분하지 않습니다. 즉, 패턴이 현재 제목과 일치하면 'A-Z'와 'a-z'는 아무런 차이가 없습니다.
'skip|S=num'
다음 규칙 또는 규칙을 건너뜁니다.
현재 규칙이 일치하는 경우 이 플래그는 다시 작성 엔진을 강제로 규칙 세트의 다음 num 규칙을 건너뜁니다. 이를 사용하여 의사 if-then-else 구문을 만듭니다. then-절의 마지막 규칙은 skip=N이 됩니다. 여기서 N은 else-절의 규칙 수입니다. ('chain|C' 플래그와 동일하지 않습니다.)
'env|E=VAR:VAL'
환경 변수를 설정합니다.
이 플래그는 값 VAL에 설정된 환경 변수 "VAR"를 만듭니다. 여기서 VAL에는 정규 표현식 역참조, $N 및 %N이 포함될 수 있으며 이 값은 확장됩니다. 이 플래그를 두 번 이상 사용하여 여러 변수를 설정할 수 있습니다. 이 변수는 나중에 %{VAR}을(를) 통해 다음 RewriteCond 패턴에서 참조할 수 있습니다. 이 플래그를 사용하여 제목에서 정보를 제거하고 기억하십시오.

RewriteCond 지시문(선택 사항)

RewriteCond 지시문은 규칙 조건을 정의합니다. RewriteCond가 RewriteRule 앞에 있으면 해당 패턴이 현재 제목과 일치하고 추가 조건이 적용되는 경우에만 규칙이 사용됩니다.
다시 작성 조건 지시문은 다음 양식을 사용합니다.
RewriteCond TestString CondPattern [Flags]

TestString 은 다음 구문을 포함할 수 있는 문자열입니다.
일반 텍스트 - 변경되지 않고 전달된 텍스트입니다.
역참조를 사용하면 Pattern 또는 CondPattern의 그룹화된 부품(괄호 안)에 액세스할 수 있습니다. 다음과 같은 두 가지 유형의 역참조가 있습니다.
  • RewriteRule Backreferences 해당 RewriteRule 패턴의 이러한 일치 역참조를 사용하고 $N(0 <= N <= 9) 형식을 사용합니다. 예, RewriteRule ^My[[:blank:]] (.*)$ ${toupper: $1}
  • RewriteCond 역참조 마지막 일치 RewriteCondPattern에서 이러한 일치 역참조를 사용하고 %N(0 <= N <= 9) 형식을 사용합니다.
변수 % 형식의 변수입니다. 여기서 NAME_OF_VARIABLE은 정의된 변수의 이름에 대한 문자열이 될 수 있습니다. 환경 변수 설정에 대한 자세한 내용은 [E] 플래그를 참조하십시오. 검색 결과를 생성한 검색 양식에서 변수를 정의할 수도 있습니다.
함수 $ 형식의 함수입니다. 여기서 NAME_OF_FUNCTION은 다음과 같습니다.
  • Tolower는 소문자에서 모든 문자를 만듭니다.
  • toupper는 모든 문자를 대문자로 만듭니다.
  • escape URL은 키의 ​모든 문자를 인코딩합니다.
  • 'a'..'z', 'A'.'Z', '0'..'9', '*', '-', '.', '/', '@' 및 '_'는 변경되지 않고 그대로 유지되고 공백은 '+'로 변환되며 다른 모든 문자는 %xx URL 인코딩된 상응하는 문자로 변환됩니다.
  • escape는 '+'를 다시 공백으로 변환하고 모든 %xx URL 인코딩 문자를 다시 단일 문자로 변환합니다.
특수 대체 문자열이 있습니다.'-'는 "대체가 없습니다"를 의미합니다. '-' 문자열은 종종 C(체인) 플래그와 함께 유용하므로 대체가 발생하기 전에 여러 패턴과 URL을 일치시킬 수 있습니다.
CondPattern 일부 추가가 있는 표준 확장 정규 표현식입니다. 패턴 문자열 앞에 '!'를 추가할 수 있습니다. 문자(느낌표)를 사용하여 일치하지 않는 패턴을 지정합니다. 실제 정규 표현식 문자열 대신 다음 특수 변형 중 하나를 사용할 수 있습니다.
이러한 모든 테스트 앞에는 느낌표('!')가 붙습니다. 그들의 의미를 무시하다.
CondPattern 문자열
설명
'<CondPattern'
어휘가 적습니다.
CondPattern 일반 문자열로 취급하여 TestString과 비교합니다 . TestString CondPattern보다 사전적으로 작으면 true입니다 .
'>CondPattern'
보다 풍부합니다.
CondPattern 일반 문자열로 취급하여 TestString과 사전적으로 비교합니다 . TestString CondPattern보다 사전적으로 큰 경우 True입니다 .
'=CondPattern'
사전적으로 동일한
CondPattern 일반 문자열로 취급하여 TestString과 사전적으로 비교합니다 . TestString CondPattern과 사전적으로 같으면 True입니다 . 즉, 두 문자열은 정확하게 동일합니다(문자별로). ContextPattern 단지 ""(두 따옴표)일 경우 TestString 빈 문자열로 비교합니다.
플래그 (선택 사항)
플래그는 대괄호로 [] 묶여 있고 여러 플래그는 쉼표로 구분되어 있습니다.
플래그
설명
'nocase|NC'(대소문자 없음)
테스트를 민감하지 않게 합니다. 즉, 확장된 TestString과 CondPattern에서 'A-Z'와 'a-z' 모두 차이가 없습니다.
'ornext|OR'(또는 다음 조건)
규칙 조건을 암시적 AND 대신 로컬 OR과 결합하려면 이 옵션을 사용합니다. 이 플래그가 없으면 콘드/규칙을 여러 번 작성해야 합니다.

표준 제목 형식이 있는 회사 웹 사이트가 있다고 가정합니다."My Company" 뒤에 하이픈이 표시된 다음 페이지별 설명("My Company - Welcome" 또는 "My Company - News" 등)이 옵니다. 제목에서 "My Company -"를 제거하고 사이트를 인덱싱할 때 전체 제목을 대문자로 변환하려고 합니다.
다음 다시 작성 규칙은 함수 터퍼를 사용하여 제목의 설명적인 부분만 대문자로 다시 씁니다.
RewriteRule  ^My[[:blank:]]Company[[:blank:]]-[[:blank:]] 
<b>(.*)</b>$  ${toupper: 
<b>$1</b>} 

규칙의 패턴에는 "내 회사" 다음에 나오는 제목 내용과 (^My[[:blank:]]Company[[:blank:]]-[[:blank:]] (.*)) 일치하는 역참조가 (.*) 포함되어 있습니다. 괄호()를 사용하여 패턴의 일부를 둘러싸면 대체에 의해 참조할 수 있는 역참조가 만들어진다는 점을 기억하십시오. 이 예에서 대체(${toupper: $1 })는 터치퍼 함수를 사용하여 해당 역참조( $1 )를 다시 씁니다.
따라서 "My Company - Welcome" 형식의 제목은 "WELCOME"으로 다시 작성되었습니다.
감사의 말
다시 작성 엔진 소프트웨어는 원래 Apache Group에서 개발하여 Apache HTTP 서버 프로젝트(https://www.apache.org/)에서 사용할 수 있었습니다.

검색 제목 규칙 추가

검색 제목 규칙을 추가하여 웹 사이트 검색 결과의 제목을 표시하는 방법을 지정할 수 있습니다. 제목에서 원하는 부분을 조작할 수 있습니다.
검색 제목 규칙을 추가하려면
  1. 제품 메뉴에서 > Settings > Rewrite Rules > Search Title Rules ​을 클릭합니다.
  2. 필드에 원하는 규칙을 Search Title Rules 입력합니다.
    '#'(해시) 문자로 시작하는 빈 줄 및 주석 줄이 허용됩니다.
  3. (선택 사항) Search Title Rules 페이지의 Test Search Title Rules 필드에 테스트 제목을 입력한 다음 테스트를 클릭합니다 .
  4. 변경 내용 저장 ​을 클릭합니다.
  5. (선택 사항) 결과를 미리 보려는 경우 스테이지된 사이트 인덱스를 다시 작성합니다.
    스테이지된 웹 사이트의 증분 인덱스 구성을 참조하십시오.
  6. (선택 사항) Search Title Rules 페이지에서 다음 중 하나를 수행합니다.
    • 아이콘을 History 클릭하여 변경한 내용을 되돌립니다.
      작업 내역 옵션 사용을 참조하십시오.
    • 클릭 Live .
      라이브 설정 보기를 참조하십시오.
    • 클릭 Push Live .
      스테이지 설정 라이브를 참조하십시오.