Show Menu
トピック×

統計指標

統計を支援するために、Data Workbenchでは、ガイド付き分析のビジュアライゼーションに3つの統計指標を提供しています。
数学はデータ内の相関関係の判断に役立ちますが、データを取り巻くコンテキストも考慮する必要があります。
  • カイ 2 乗 p 値 ​は、統計的有意性のテストであり、この値によりビジュアライゼーションのチェックマークの表示が制御されます。数学的には、帰無仮説(2 つのグループの間に観察される違いはランダムな変化で説明できるという仮説)を棄却できる確率です。実用の面では、カイ 2 乗 p 値がほぼ 100 %でない限り、測定した強さ(次の U 統計量と V 統計量の項で説明)にかかわらず、相関関係を無視できます。
  • U 統計量 ​は、統計的相関の強さを示す尺度です。数学的には、情報理論と呼ばれる数学の分野から発生した尺度であり、2 つのグループの分布の間の相互情報量の概念と密接に関連しています。または、一方のグループに対して最適なコーディング方法が与えられた場合の他方のグループの圧縮率と考えることもできます。実用の面では、多くの要素にほとんど訪問者が含まれていないというディメンションがよくありますが、そのようなケースで、この統計量は非常に役立ちます。この統計量は、0(弱)~ 1(強)の間で変化します。
  • V 統計量 ​も、統計的相関の強さを示す尺度です。数学的には、有名なクラマーの V 統計量に関係しますが、選択を反転させたときの統計量の対称性を改善するための正規化手順のみが異なります。実用の面では、この統計量は様々なタイプのディメンションで使用でき、一般的に使用される統計量と関連があります。この統計量は、0(弱)~ 1(強)の間で変化します。
U統計とV統計は互いを補うように選択され、それぞれが、他方が強く応答しない可能性のある相関のタイプを検出するよう調整されました。
このビジュアライゼーションをガイドとして使用し、他のビジュアライゼーションをワークスペースに追加して、選択に基づいた、データに対する洞察を深めることができます。
次の Site の例には、1 月、2 月、3 月、4 月の日付のセッションを示す棒グラフがあります。1 月の中の 1 日が選択されています。
ワークスペースの左下のガイド付き分析ビジュアライゼーションは、選択した日に関する有益な情報がセッション番号ディメンションにより提供されることを示しています。
ワークスペースの右下のセッション番号の横向き棒グラフを調べると、セッション番号 2 のデータがベンチマークより非常に低いことがわかります。こうして、選択した日は、割合として、通常よりも 2 番目のセッションの発生が少なかったと結論できます。ガイド付き分析ビジュアライゼーションに一覧表示されたディメンションの横向き棒グラフを表示するには、マウスでディメンションをクリックしてディメンションを選択するだけです。