Show Menu
トピック×

セグメント比較で使用される統計テスト

それぞれのトップの比較テーブルには、おこなわれた比較に基づくいくつかの統計テストによって計算された差異スコアが表示されますが、差異スコアは、使用されたテストにかかわらず、0~1 の値で示されます。
スコア 0 は、2 つのセグメント間で違いがないことを意味し、スコア 1 は、2 つのセグメント間で非常に大きな違いがあることを意味します。これらの差異スコアを生成するために使用される統計テストには 2 種類あります。トップの指標のテーブルには、マンホイットニーの U 検定が使用され、上位のディメンション項目および上位のセグメントのテーブルには、リスク差比較が使用されます。

トップの指標の差異スコア

トップの指標のテーブルでは、セグメント比較ツールは、2 つのサンプルのマンホイットニーの U 検定を使用します。これは、考慮される各セグメントに対する各指標の 1 次元の確率分布を比較するために使用されるノンパラメトリック等価性テストです。指標テーブルの差異スコアは、計算された U 統計からの p 値(特定の指標全体に分散された 2 つのセグメントが確率的にどのように異なるかを表す)と計測された差異の相対的な大きさの組み合わせです。大きな差異スコア(1 に近い)は、特定の指標に大きな相対的な差異と、セグメントが異なることの高い統計的信頼性があることを意味します。

上位のディメンション項目と上位のセグメントの差異スコア

上位のディメンション項目および上位のセグメントの差異のテーブルに対する差異スコアを計算するために、相対リスク差アルゴリズムが使用されます(比率でなく差を使用しますが、リスク比に似ています)。リスク差は、選択したセグメントの一方のディメンション項目の累積発生率(またはセグメントのテーブルからのセグメントの重複)を他方から減算することで計算されます。高い差異スコア(1 に近い)は、特定のディメンション項目または第 3 のセグメントが、選択したセグメントの 1 つで非常に目立ち、他方では目立たないことを意味します。
統計的な正確性を維持しながら可能な限り早く処理を実行するために、3 つすべてのテーブルで、差異統計は訪問者の適切なサンプルに基づいています。差異スコアがサンプルに基づいているのに対して、テーブルに表示される結果は、サンプルではありません。統計的有意性を確保するために、各統計テストは、3 %未満の誤差のサンプルサイズのより小さいセグメントを含むような動的割り当てアルゴリズムを信頼します。セグメントが訪問者をほとんど含まない(1,000 未満)場合、利用可能なすべてのデータを使用し、差異スコアの計算でサンプリングをおこないません。