Show Menu
화제×

CrossRows

다른 변형과 마찬가지로 CrossRows 변환도 로그 소스의 데이터 행(로그 항목)에 적용됩니다.
각 데이터 행에 대해 변환은 지정된 입력 필드의 값을 가져와서 처리 단계 집합을 수행하고 지정한 출력 필드에 결과를 기록합니다. 그러나 변형이 한 데이터 행(이 행은 출력 행이라고 함)에서 작동하면 동일한 추적 ID와 연결된 하나 이상의 다른 데이터 행(이러한 행은 입력 행이라고 함)을 더한 것이 고려됩니다. CrossRows 따라서 지정된 추적 ID의 경우 각 출력 행에 대한 출력 필드 값은 하나 이상의 입력 행에 대한 입력 필드 값을 기반으로 합니다.
변환은 변환에 대한 입력 행을 제한할 수 있는 여러 조건 및 제한을 제공합니다. 데이터 워크벤치 서버 조건(조건 참조) 조건 정보 , 출력 행에 상대적인 입력 행 범위 또는 출력 행 시간에 대한 범위 등을 정의할 수 있습니다. 변환의 조건과 제약 조건을 만족하는 입력 행의 경우 출력 필드의 값을 결정하는 작업(예: SUM)을 적용할 수 있습니다.
이 작업을 수행하려면 CrossRows 데이터를 시간 단위로 정렬하고 소스 데이터의 추적 ID로 그룹화해야 합니다. 따라서 CrossRows 파일 또는 Transformation.cfg Transformation Dataset Include 파일에서 정의될 때만 작동합니다.
다음 표의 매개 변수 설명을 검토할 때 다음 사항을 기억하십시오.
  • 출력 행은 특정 시점에 변형이 작동하는 데이터의 행입니다.
  • 입력 행은 입력 필드의 값이 변환에 대한 입력으로 사용되는 다른 데이터 행(이전, 이후 또는 출력 행 포함)입니다. 입력 행은 입력 조건, 키, 행 시작, 행 끝, 시간 시작 및 시간 종료 매개 변수의 적용을 받습니다.
매개 변수 설명 기본값
이름 변환의 설명 이름입니다. 여기에 이름을 입력할 수 있습니다.
설명 선택 사항입니다. 변환에 대한 참고 사항.
조건 변환 출력을 특정 로그 항목으로 제한합니다. 특정 로그 항목에 대한 조건이 충족되지 않으면 출력 매개 변수의 필드가 변경되지 않은 상태로 유지됩니다. 다른 로그 항목에 영향을 주는 데 여전히 입력을 사용할 수 있습니다.
입력 입력으로 사용할 입력 행의 필드 이름입니다.
입력 조건 특정 입력 행에서만 변환에 대한 입력을 허용합니다. 특정 입력 행에 대해 입력 조건이 충족되지 않으면 해당 행의 입력 필드가 무시되고 다른 출력 행에 영향을 주지 않습니다. 그러나 해당 행의 출력 필드는 지정된 조건에 따라 여전히 수정됩니다.
선택 사항입니다. 키로 사용할 필드의 이름입니다.
키가 지정된 경우 지정된 출력 행의 입력 행은 출력 행과 키 값이 동일한 인접한 행 블록으로 제한됩니다. 이 제한은 CrossRows 변환의 다른 매개 변수에 의해 입력 행에 배치된 다른 모든 제한 사항뿐만 아니라 적용됩니다.
예를 들어 웹 데이터를 사용하여 작업하는 경우 x-session-key 필드(각 세션에 대한 고유 값)를 키로 지정하면 변환에 대한 입력 행은 출력 행과 동일한 x-session-key 값을 갖는 행으로 제한됩니다. 따라서 출력 행과 동일한 세션 동안 발생하는 페이지 보기를 나타내는 입력 행만 고려합니다.
작업
각 출력 행에 대해 입력 조건, 키, 행 시작, 행 끝, 시간 시작 및 시간 종료 매개 변수에 의해 정의된 모든 조건을 만족하는 모든 입력 행에 적용되는 작업입니다.
  • ALL은 입력 행에서 입력 필드의 모든 값을 가져와 벡터로 출력합니다.
  • SUM 파섹
  • 첫 번째 행 입력은 첫 번째 입력 행에서 입력 필드 값을 출력합니다.
  • 마지막 행 입력은 마지막 입력 행에서 입력 필드 값을 출력합니다.
출력 출력 필드의 이름입니다.
행 시작/행 끝
선택 사항입니다. 출력 행을 기준으로 입력 행 범위를 지정합니다. 예를 들어 행 시작 값 "0"은 출력 행 앞에 있는 모든 행을 제외합니다. 행 시작 값 "1"은 출력 행도 제외합니다. 일반 범위에는 다음이 포함됩니다.
  • 시작 0:이 행과 그 이후의 모든 행.
  • 시작 1:이후의 모든 행.
  • 종료 0:이 행과 모든 이전 행.
  • 끝 -1:모든 이전 행.
  • 시작 -1, 끝 -1:이전 행.
  • 시작 1, 종료 1:다음 줄
모든 행
시간 시작/시간 종료
선택 사항입니다. 출력 행 시간을 기준으로 시간 범위를 지정합니다. 예를 들어, 30분의 끝 시간은 출력 행 후 30분 이내에 발생하는 모든 행을 포함합니다. 시간 시작인 -30분은 출력 행 30분 이내에 발생하는 모든 행을 포함합니다.
사용 가능한 시간 단위는 일, 주, 시간, 분, 밀리초, 눈금(100나노초) 및 ns(나노초)입니다.
항상
이 CrossRows 예제의 변환은 다음 페이지 보기 시간에 대해 각 페이지 보기에 대해 찾기 위해 웹 데이터 행에 적용됩니다. 데이터 집합 구성 프로세스의 변형 단계 동안에만 데이터 행이 CrossRows 적용된다는 것을 알기 때문에 방문자(각 방문자의 고유 추적 ID가 있음) 및 시간이 데이터 행을 순서대로 정렬합니다.
x-timestamp 입력 필드는 x-is-page-view 필드가 채워지는 입력 행에 대해서만 고려됩니다(데이터 행이 페이지 보기를 나타남). Key 매개 변수에 대해 x-session-key 필드(각 세션에 대한 고유 값이 있음)가 지정됩니다. 따라서 변환에 대한 입력 행(로그 항목)은 출력 행과 동일한 x-session-key 값을 갖는 인접한 행 블록으로 제한됩니다. 즉, 변환에 대해 고려될 입력 행은 출력 행의 페이지 보기와 동일한 세션 중에 발생하는 페이지 보기를 나타내야 합니다. 첫 번째 행 작업은 조건을 만족하는 첫 번째 입력 행에서 출력 필드의 값을 Input 가져와서 출력 행과 동일한 x-session-key 값을 갖습니다.
CrossRows 입력 크기와 출력 크기에 비례하여 실행합니다. 즉, SUM, FIRST ROW 및 LAST ROW의 경우 다른 변형보다 효율적으로 작업할 수 있습니다. ALL의 경우, 주어진 추적 ID에 대한 행(로그 항목)의 총 수에 비례하는 각 데이터 행(로그 항목)에 대한 데이터 양을 출력하도록 구성할 CrossRows 수 있기 때문에 상황이 더 복잡합니다.