Show Menu
화제×

긴 꼬리 차원 항목

고유 값이 많은 차원을 사용하는 경우 "긴 꼬리"라는 레이블이 붙은 보고서에서 값을 볼 수 있습니다. 이 차원 항목은 보고 아키텍처 CJA가 사용하는 보고서에 처리할 고유 값이 너무 많다는 것을 의미합니다.

CJA 처리 아키텍처 및 고유 값

CJA는 실행 시 보고서를 처리하여 결합된 데이터 세트를 여러 서버에 배포합니다. 처리 서버당 데이터는 개인 ID로 그룹화됩니다. 즉, 단일 처리 서버에 지정된 사람에 대한 모든 데이터가 포함됩니다. 처리가 완료되면 처리된 데이터의 하위 집합을 수집기 서버로 전송합니다. 처리된 데이터의 모든 하위 세트가 결합되어 작업 공간 보고서의 형태로 반환됩니다.
데이터 하위 집합을 처리하는 개별 서버가 500,000개 이상의 고유한 차원 항목을 발견하는 경우, 자체 하위 집합의 상위 500,000개 차원 항목을 반환한 다음 나머지 항목을 'Long Tail' 아래에 반환합니다. 작업 공간 보고서에 표시되는 '롱테일' 차원 항목은 500K 고유 값을 초과하는 각 개별 처리 서버 값의 집계된 합계입니다.

롱테일-저트래픽 차이점

이전 버전의 Adobe Analytics에서는 다른 처리 아키텍처가 사용되었습니다. 데이터가 수집되었을 때 처리되었습니다. 차원이 500K 고유 값에 도달한 후 차원 항목이 '낮은 트래픽' 아래에 배치되었으며 1M 고유 값에 더 적극적인 필터링을 적용했습니다. 고유한 값 개수가 각 달력 월의 시작 시 재설정되었습니다. 처리된 데이터가 영구적이었습니다. '낮은 트래픽'에서 기존 데이터를 얻을 수 있는 방법이 없었습니다.
CJA에서 개별 처리 서버에 50K 이상의 고유 값이 포함된 경우 차원 항목은 '롱테일'에만 입력됩니다. 처리된 데이터는 영구적이지 않으므로 보고서를 수정하여 '긴 꼬리' 차원 항목을 줄일 수 있습니다.

'긴 꼬리' 차원 항목 감소

'긴 꼬리' 차원 항목을 줄이려면 다음 중 하나를 권장합니다.
  • 세그먼트 사용. 세그먼트는 각 서버가 데이터 하위 집합을 처리할 때 적용됩니다. 반환되는 고유 값의 수를 제한하면 'Long Tail' 차원 항목이 줄어듭니다.
  • 조회 데이터 집합 차원을 사용합니다. 데이터 집합 차원을 조회하여 반환된 고유 값 수를 제한하는 이벤트 데이터 집합 차원 항목을 결합합니다.
전체적으로 500K 이상의 고유 차원 항목이 포함된 보고서를 사용하기가 어렵습니다. 세그먼트 또는 조회 데이터 세트 차원을 적용하는 경우 '롱테일'의 존재를 줄이면서 보고서를 더 쉽게 사용할 수 있습니다. CJA가 추가로 개발됨에 따라 Adobe는 이러한 경험을 개선할 계획입니다.