Show Menu
화제×

세그먼트 비교에 사용되는 통계 테스트

위쪽의 각 비교 테이블에는 수행되는 비교에 따라 몇 가지 통계 테스트에 의해 계산되는 차이 점수가 표시됩니다. 그렇지만 사용되는 테스트에 관계없이, 차이 점수는 0과 1 사이의 값으로 표시됩니다.
점수 0은 두 세그먼트 간에 차이가 없는 것이고 점수 1은 두 세그먼트 가에 아주 큰 차이가 있다는 뜻입니다. 이러한 차이 점수를 생성하기 위해 두 가지 유형의 통계 테스트가 사용됩니다. 상위 지표 테이블의 경우에는 Mann-Whitney U 테스트가 사용되고, 상위 차원 항목 및 상위 세그먼트 테이블의 경우에는 위험 차이 비교가 사용됩니다.

Top metrics difference score

상위 지표 테이블에서 세그먼트 비교 도구는 2개의 샘플 Mann-Whitney U 테스트를 사용합니다. 이 테스트는 고려되는 각 세그먼트의 각 지표에 대한 1차원 확률 분포를 비교하는 데 사용되는 비매개 변수 동일성 테스트입니다. 지표 테이블의 차이 점수는 계산된 U 통계의 p 값(두 세그먼트가 특정 지표에서 확률적으로 얼마나 다른지를 나타냄)과 관찰된 크기를 조합한 것입니다. 차이 점수가 큰 경우(1에 가까움) 세그먼트가 다르다는 통계적 신뢰도가 높을 뿐 아니라 특정 지표가 상대적으로 큰 차이를 보인다는 것을 의미합니다.

Top dimension items and top segments difference scores

상위 지표 항목 및 상위 세그먼트 차이 테이블의 차이 점수를 비교하기 위해 상대적 위험 차이 알고리즘이 사용됩니다(비율이 아닌 차이를 사용하는 경우에도 위험비와 비슷함). 위험 차이는 다른 세그먼트의 차원 항목 누적 발생(또는 세그먼트 테이블의 세그먼트와의 겹침)에서 선택된 단일 세그먼트의 해당 크기를 빼서 계산합니다. 차이 점수가 높으면(1에 가까움) 특정 차원 항목 또는 세 번째 세그먼트가 선택된 세그먼트 중 하나와 비교할 때만 두드러지게 차이를 보이고 다른 세그먼트와는 큰 차이를 보이지 않는 것입니다.
세 개의 표 모두에서 차이 통계는 통계적으로 정확하게 남아 있는 상태에서 프로세스를 가능한 한 빨리 실행하기 위해 적절한 방문자 샘플을 기반으로 합니다. 차이 점수는 샘플을 기준으로 하지만 테이블에 표시되는 결과는 샘플링되지 않습니다. 의의도를 보장하기 위해 각 통계 테스트는 좀 더 작은 세그먼트에 오차가 3% 미만인 샘플 크기가 포함되도록 하는 다이내믹 할당 알고리즘에 의존합니다. 세그먼트에 아주 적은 수의 방문자(1,000명 미만)가 포함되어 있는 경우에는 사용 가능한 모든 데이터가 사용되며 차이 점수를 계산할 때 샘플링이 수행되지 않습니다.