Show Menu
화제×

기여도 분석에 사용된 통계 기법

기여도 분석은 Adobe Analytics에서 관찰된 예외 항목에 기여한 사항을 드러내도록 설계된 집중 기계 학습 프로세스입니다. 이 프로세스의 목적은 사용자가 집중 영역이나 추가 분석 기회를 원래 가능한 것보다 훨씬 더 빨리 찾는 것을 돕는 것입니다.
기여도 분석은 사용자의 기여도 분석 보고서에서 사용할 수 있는 모든 단일 차원 항목에 대해 2부분 알고리즘을 수행하여 이 작업을 수행합니다. 알고리즘은 다음 순서로 작동합니다.
  1. 각 차원에 대해 Cramer의 V 테스트 통계를 계산합니다. 다음 예에서, 두 개의 시간 기간에 대해 국가별 페이지 보기 횟수를 보여주는 분할표를 고려하십시오.
    표 1에서 Cramer의 V를 사용하여 기간 1(예: 내역)과 기간 2(예: 예외 항목이 발생한 날) 동안 국가별로 페이지 보기 간의 연결을 측정할 수 있습니다. Cramer의 V에 대한 낮은 값은 낮은 수준의 연관성을 의미합니다. Cramer의 V는 0(연결 없음)에서 1(전체 연결)까지의 범위에 포함됩니다. Cramer의 V 통계를 계산할 수 있습니다.
  2. 각 차원 항목에 대해, 개인의 잔존(PR)은 예외 항목 지표와 각 차원 항목 간의 연관성을 측정하는 데 사용됩니다. PR은 표준 정규 분포를 따르며, 이 분포에서 알고리즘은 편차가 비교할 수 없이 작더라도 임의의 두 변수에 대한 PR을 비교할 수 있습니다. 실제로, 이 오류는 알려져 있지 않으며, 한정된 샘플 수정을 사용하여 평가됩니다.
    이전 예의 표 1에서, 국가 i 및 기간 2에 대한 한정된 샘플 수정이 있는 PR은 다음 식으로 주어집니다.
    여기에서,
    (기간 1에 대해 유사한 공식을 얻을 수 있습니다.)
    최종 결과의 경우 각 차원 항목의 점수는 Cramer의 V 측정값에 의해 가중치가 적용되며 기여도 점수를 제공하기 위해 0에서 1 사이의 숫자로 다시 조정됩니다.