Show Menu
화제×

로그 처리 매개 변수

Log Processing.cfg 파일의 특정 매개 변수에 대한 추가 정보에 대한 링크

데이터 필터

파일에 정의된 필터는 다음과 같습니다. Log Processing.cfg
  • 종료 시간
  • 해시 임계값
  • 시작 시간
이러한 매개 변수에 의해 정의된 필터링은 로그 항목이 디코더를 종료하거나 변형 후에 를 기준으로 평가하기 전에 발생합니다 Log Entry Condition. 일반적으로 이러한 매개 변수를 변경하면 데이터 세트 구성이 변경됩니다.
데이터 소스를 사용하여 특정 기간을 포함하는 데이터 세트를 구성하는 데 권장되는 방법은 데이터 세트에 대해 시작 시간 및 종료 시간 매개 변수를 사용하는 것입니다. Sensor
시작 시간 및 종료 시간 매개 변수를 사용하여 로그 파일을 디렉토리별로 구분하는 등의 다른 방법보다 사용하는 것이 좋습니다. 데이터 워크벤치 서버는 데이터 세트에 대한 시작 및 종료 시간을 설정하여 지정된 간격 내에 발생한 로그 항목만 자동으로 사용합니다. 종료 시간이 과거라고 가정할 경우 데이터 워크벤치 서버는 일반적으로 데이터 세트가 새 변형 추가와 같이 업데이트되더라도 동일한 로그 항목 집합을 사용하여 데이터 세트를 업데이트합니다.

로그 항목

기본적으로 사용 가능한 로그 항목의 필터링 프로세스입니다. 값이 false Log Entry Condition 값을 반환하면 사용 가능한 로그 항목 집합에서 로그 항목이 필터링됩니다.
은 조건 작업(조건 참조)을 사용하여 Log Entry Condition 설명되며 , 이 Sensor 입력 필드(데이터 워크벤치 가이드 참조)나 테스트 조건을 정의하기 위해 파일 내에 포함된 변환에 의해 생성된 확장 필드를 사용할Sensor Log Processing.cfg 수 있습니다. Log Entry 조건은 로그 처리 중에 적용되며 변환 중에 적용할 수도 있습니다.
이 예에서는 웹 사이트 데이터의 log entry condition 사용을 보여 줍니다. 이 변수를 Log Entry Condition 사용하여 웹 사이트의 특정 부분에 집중하는 데이터 세트 또는 사이트에서 특정 작업을 수행하는 방문자를 만들 수 있습니다.
이 Log Entry Condition 예제에서는 사이트 스토어에 속한 로그 항목만 포함하는 데이터 세트를 만듭니다. 정규 표현식에 대한 입력으로 RECondition test 일치 패턴 "/store/.*" 및 cs-uri-stem 필드를 사용하면 문자열로 시작하는 웹 페이지만 데이터 세트에 "/store/" 포함됩니다.

키 분할

데이터 세트에 있는 추적 ID의 수는 인위적으로 증가하지만 데이터 워크벤치 서버에서 처리하는 총 로그 항목 수는 인위적으로 증가하지 않으므로 데이터 세트에 있는 계산 가능한 총 이벤트 수는 유지됩니다. 단일 요소에 대한 데이터가 분할되면 데이터는 두 개의 서로 다른 추적 ID와 영원히 연결되어 있으므로 관련될 수 없습니다.
예를 들어 웹 데이터를 사용하여 작업하는 경우 각 추적 ID는 고유 방문자를 나타냅니다. 키 분할을 활성화하면 대량의 이벤트 데이터가 있는 데이터 세트에 있는 방문자가 여러 방문자로 분할됩니다. 데이터 세트에 방문자 수가 인위적으로 증가하더라도 페이지 보기 또는 예약과 같이 카운트되지 않은 총 이벤트 수는 인위적으로 증가하지 않습니다. 분할이 발생하면 하위 방문자에 대한 데이터는 관련될 수 없습니다.
키 분할은 확률적 알고리즘을 사용합니다. 그 결과 메모리 사용, 오류 가능성, 키 분할 임계값( Split Key Bytes) 및 데이터 세트 크기 간에 연결이 해제됩니다. 권장 설정(아래에 나열됨)을 사용하면 실패 비율이 낮습니다. 이벤트 데이터가 키 분할 임계값을 초과하는 요소 중 약 22,000분의 1(일반적으로 데이터 세트당 1개 미만)의 데이터는 분할이 아닌 잘립니다.
다음 표에 각 매개 변수(키 분할 없이)에 대해 권장되는 값이 표시됩니다.
매개 변수
키 분할 없음
키 분할
그룹 최대 키 바이트
1e6
2e6
키 버킷 공간 분할
6e6
6e6
키 바이트 분할
0
1e6
분할 키 공간 비율
10
10
Group Maximum Key Bytes 단일 추적 ID에 대해 처리할 수 있는 최대 이벤트 데이터 양을 지정합니다. 이 제한을 초과하는 데이터는 데이터 집합 구성 프로세스에서 필터링됩니다. Split Key Bytes 은 단일 추적 ID가 여러 요소로 분할되는 바이트 수를 나타냅니다. 요소는 가능성 분포에 따라 약 이 바이트 수로 분할됩니다. Split Key Space Ratio 키 분할의 메모리 사용률 및 실패율을 Split Key Bucket Space 제어할 수 있습니다.
Group Maximum Key Bytes, Split Key Bytes​Split Key Space Ratio, and Split Key Bucket Space all must be 선언되어야 합니다. Adobe에 문의하지 않고 이러한 매개 변수의 값을 변경하지 마십시오.