Show Menu
SUJETS×

Tests statistiques utilisés dans la comparaison de segments

Chacun des principaux tableaux de comparaison présente un score de différence calculé par plusieurs tests statistiques, selon le mode de comparaison. Toutefois, quel que soit le test utilisé, le score de différence est présenté comme une valeur comprise entre 0 et 1.
Un score nul signifie qu’il n’y a aucune différence entre les deux segments ; un score de 1 signifie qu’il existe une très grande différence entre les deux segments. Deux types de tests statistiques sont employés pour générer ces scores de différence : un test U de Mann-Whitney pour le tableau des mesures principales, une comparaison des différences de risque pour les principaux éléments de dimension et les principaux segments.

Top metrics difference score

Dans le tableau Mesures principales, l’outil Comparaison des segments applique un test U de Mann-Whitney à deux échantillons, à savoir un test d’égalité non paramétrique servant à comparer les distributions de probabilité unidimensionnelles de chaque mesure pour chaque segment pris en compte. Le score de différence dans le tableau de mesures est une combinaison de la valeur p de la statistique U calculée (qui représente le degré stochastique (aléatoire) de différence de distribution des deux segments pour une mesure particulière) et la magnitude relative de la différence observée. Un score de différence élevé (proche de 1) signifie que la mesure particulière présente une différence relative élevée ainsi qu’une forte fiabilité statistique que les segments diffèrent.

Top dimension items and top segments difference scores

Pour calculer le score de différence des tableaux Principaux éléments de dimension et Principaux segments, un algorithme de différenciation des risques relatifs est appliqué (semblable au ratio de risque, bien qu’une différence soit utilisée à la place d’un ratio). Une différence de risque est calculée en soustrayant les incidences cumulées d’un élément de dimension (ou le chevauchement avec un segment du tableau de segments) du segment sélectionné par rapport à un autre. Un score de différence élevé (proche de 1) signifie que l’élément de dimension particulier ou le segment tertiaire était prédominant dans l’un des segments sélectionnés mais pas dans l’autre.
Dans les trois tableaux, la statistique des différences est basée sur un échantillon approprié de visiteurs pour que le processus s’exécute le plus rapidement possible tout en restant statistiquement précis. Même si le score de différence repose sur un échantillon, les résultats présentés dans le tableau ne sont pas échantillonnés. Pour garantir une signification statistique, chaque test statistique s’appuie sur un algorithme d’allocation dynamique de sorte que le segment le plus petit contienne une taille d’échantillon garantissant une marge d’erreur de moins de 3 %. Si un segment contient très peu de visiteurs (moins de 1 000), nous utilisons toutes les données disponibles et ne les échantillons pas lors du calcul du score de différence.