Show Menu
主题×

区段比较中使用的统计测试

排名最前的每个比较表都会显示一个差异分数,该分数由若干统计测试根据所做的比较计算得出;但是,无论使用哪个测试,差异分数都显示为一个介于 0 到 1 之间的值。
0 分表示两个区段之间没有差异,1 分表示两个区段之间有非常大的差异。用来生成这些差异分数的统计测试有两种:对于热门量度表,使用 Mann-Whitney U 测试;对于主要维度项目表和排名最前的区段表,使用风险差异比较。

热门量度差异分数

在热门量度表中,区段比较工具使用双样本 Mann-Whitney U 测试,这是一种非参数等式测试,用来比较所考虑的每个区段中每个量度的一维概率分布。量度表中的差异分数是一个综合分数,包括来自计算的 U 统计量的 P 值(表示两个区段在特定量度中随机分布的差异程度)和所观察到差异的相对大小。较大的差异分数(接近 1 分)表示特定量度具有相对较大的差异,并对于区段存在差异具有较高的统计置信度。

主要维度项目和排名最前的区段差异分数

要计算主要维度项目和排名最前的区段差异表上的差异分数,请使用相对风险差异算法(与风险比率类似,只是使用差异分数取代了比率)。风险差异的计算方法是从其他区段减去某个选定区段中维度项目(或与区段表中某个区段的重叠)的累积发生率。高差异分数(接近 1 分)表示特定维度项目或第三个区段在选定的一个区段中非常突出,而在另一个区段中并不突出。
在所有三个表中,差异统计都基于适当的访客取样,这样既可以尽可能快速地运行统计过程,又可以保持统计学上的准确性。虽然差异分数基于取样,但不会对表中显示的结果进行取样。为了确保统计显著性,每个统计测试都依赖于一个动态分配算法,以便较小的区段能够包含误差范围小于 3% 的取样大小。如果区段包含很少的访客(少于 1,000 名),我们将在差异分数计算中使用所有可用数据,而不会取样。