Référence - fonctions avancées
Accédez à ces fonctions en cochant Afficher les options avancées dans la liste déroulante Fonctions.
Fonctions de tableau et fonctions de ligne
Une fonction de tableau consiste à ce que la sortie soit la même pour chaque ligne du tableau. Une fonction de ligne consiste à ce que la sortie soit différente pour chaque ligne du tableau.
Que signifie le paramètre d’inclusion de zéros ?
Il indique s’il faut inclure des zéros dans le calcul. Parfois, zéro signifie « rien » mais parfois, il est important.
Par exemple, en présence d’une mesure Recettes, vous ajoutez une mesure Pages Vues au rapport. Soudainement, des lignes supplémentaires apparaissent pour votre recette, qui contiennent toutes zéro. Vous souhaitez probablement que cela n’affecte pas les calculs de MOYENNE, de MINIMUM, de QUARTILE, etc. de la colonne des recettes. Dans ce cas, vous devez activer le paramètre d’inclusion de zéros.
D’un autre côté, si deux mesures vous intéressent, il n’est pas juste d’indiquer que l’une dispose d’une moyenne ou d’un minimum supérieur car certaines de ses lignes sont des zéros. Dans ce cas, n’activez pas le paramètre permettant d’inclure des zéros.
AND
Renvoie la valeur de son argument. Utilisez NOT pour vous assurer qu’une valeur est différente d’une valeur spécifique.
AND(logical_test1,[logical_test2],...)
Nombre distinct approximatif (dimension)
Renvoie le nombre distinct approximatif d’éléments de dimension pour la dimension sélectionnée. La fonction utilise la méthode HyperLogLog (HLL) d’approximation des nombres distincts. Elle est configurée pour garantir que la valeur est comprise dans les 5 % de la valeur réelle 95 % du temps.
Approximate Count Distinct (dimension)
Exemple de cas d’utilisation
Le nombre distinct approximatif (eVar ID de client) est un cas d’utilisation courant pour cette fonction.
Définition d’une nouvelle mesure calculée « Nombre approximatif de clients » :
Voici comment cette mesure pourrait être utilisée dans les rapports :
Valeurs uniques dépassées
Les fonctions Like Count(), RowCount() et Approximate Count Distinct() sont soumises aux limites « Valeurs uniques dépassées ». Si la limite « Valeurs uniques dépassées » est atteinte au cours d’un mois spécifique pour une dimension, la valeur est comptée en tant que 1 élément de dimension.
Comparaison des fonctions de comptage
La fonction Approximate Count Distinct() est une amélioration des fonctions Count() et RowCount(), car vous pouvez utiliser la mesure créée dans un rapport de dimensions pour générer un nombre approximatif d’éléments pour une dimension distincte. Par exemple, un nombre d’ID de client utilisés dans un rapport Type d’appareil mobile.
Cette fonction sera légèrement moins précise que Count() et RowCount(), car elle utilise la méthode HLL alors que Count() et RowCount() sont des nombres exacts.
Arc cosinus (ligne)
Renvoie l’arc cosinus, ou l’inverse du cosinus, d’une mesure. L’arc cosinus d’un nombre est l’angle dont le cosinus vaut ce nombre. L’angle renvoyé est donné en radians dans la plage 0 (zéro) à pi. Si vous souhaitez convertir le résultat de radians en degrés, multipliez-le par 180/PI( ).
ACOS(metric)
Arc sinus (ligne)
Renvoie l’arc sinus, ou le sinus inverse, d’un nombre. L’arc sinus d’un nombre est l’angle dont le sinus vaut ce nombre. L’angle renvoyé est donné en radians dans la plage -pi/2 à pi/2. Pour exprimer l’arc sinus en degrés, multipliez le résultat par 180/PI( ).
ASIN(metric)
Arc tangent (ligne)
Renvoie l’arc tangent, ou la tangente inverse, d’un nombre. L’arc tangent d’un nombre est l’angle dont la tangente vaut ce nombre. L’angle renvoyé est donné en radians dans la plage -pi/2 à pi/2. Pour exprimer l’arc tangent en degrés, multipliez le résultat par 180/PI( ).
ATAN(metric)
Régression exponentielle : Y prédit (ligne)
Calcule les valeurs y prédites (metric_Y), selon les valeurs x connues (metric_X) en utilisant la méthode des « moindres carrés » pour calculer la ligne de meilleure approximation basée sur.
ESTIMATE.EXP(metric_X, metric_Y)
Cdf-T
Renvoie le pourcentage des valeurs d’un distribution en t de Student avec n degrés de liberté ayant un score centré réduit inférieur à x.
cdf_t( -∞, n ) = 0
cdf_t( ∞, n ) = 1
cdf_t( 3, 5 ) ? 0.99865
cdf_t( -2, 7 ) ? 0.0227501
cdf_t( x, ∞ ) ? cdf_z( x )
Cdf-Z
Renvoie le pourcentage des valeurs d’une distribution normale ayant un score centré réduit inférieur à x.
cdf_z( -∞ ) = 0
cdf_z( ∞ ) = 1
cdf_z( 0 ) = 0.5
cdf_z( 2 ) ? 0.97725
cdf_z( -3 ) ? 0.0013499
Plafond (ligne)
Renvoie l’entier le plus petit, non inférieur à une valeur donnée. Par exemple, si vous souhaitez éviter de signaler les décimales de devise pour les recettes et qu’un produit a une recette de 569,34 $, utilisez la formule CEILING(Revenue) pour arrondir la recette au dollar le plus proche, soit 570 $.
CEILING(metric)
Degré de confiance
Le degré de confiance est une mesure probabiliste de l’ampleur des preuves sur le fait qu’une variante donnée est identique à la variante de contrôle. Un degré de confiance plus élevé indique moins de preuves relatives à l’hypothèse que la variante de contrôle et la variante de non-contrôle ont des performances similaires.
fx Confidence (normalizing-container, success-metric, control, significance-threshold)
Cosinus (ligne)
Renvoie le cosinus de l’angle donné. Si l’angle est en degrés, multipliez l’angle par PI( )/180.
COS(metric)
Racine cubique
Renvoie la racine cubique positive d’un nombre. La racine cubique d’un nombre est la valeur de ce nombre élevée à la puissance 1/3.
CBRT(metric)
Cumulé
Renvoie la somme des x pour les N dernières lignes (dans l’ordre défini par la dimension, en utilisant des valeurs d’empreinte pour les champs basés sur des chaînes).
Si N <= 0, elle utilise toutes les lignes précédentes. Puisque la moyenne cumulée est triée selon la dimension, elle n’est utile que pour les dimensions qui possèdent un ordre naturel, comme la date ou la longueur de chemin.
| Date | Rev | cumul(0,Rev) | cumul(2,Rev) |
|------+------+--------------+--------------|
| May | $500 | $500 | $500 |
| June | $200 | $700 | $700 |
| July | $400 | $1100 | $600 |
Moyenne cumulée
Renvoie la moyenne des N dernières lignes.
Si N <= 0, elle utilise toutes les lignes précédentes. Puisque la moyenne cumulée est triée selon la dimension, elle n’est utile que pour les dimensions qui possèdent un ordre naturel, comme la date ou la longueur de chemin.
cumul(revenue)/cumul(person)
equal (égal à)
Renvoie des éléments qui correspondent exactement à une valeur numérique ou de chaîne.
Régression exponentielle : coefficient de corrélation (tableau)
Renvoie le coefficient de corrélation, r, entre deux colonnes de mesures (metric_A et metric_B) pour l’équation de régression.
CORREL.EXP(metric_X, metric_Y)
Régression exponentielle : ordonnée à l’origine (tableau)
Renvoie l’ordonnée à l’origine, b, entre deux colonnes de mesures (metric_X et metric_Y) pour
INTERCEPT.EXP(metric_X, metric_Y)
Régression exponentielle : inclinaison (tableau)
Renvoie l’inclinaison, a, entre deux colonnes de mesures (metric_X et metric_Y) pour
SLOPE.EXP(metric_X, metric_Y)
Plancher (ligne)
Renvoie l’entier le plus grand, non supérieur à une valeur donnée. Par exemple, si vous souhaitez éviter de signaler les décimales de devise pour les recettes et qu’un produit a une recette de 569,34 $, utilisez la formule FLOOR(Revenue) pour arrondir la recette au dollar le plus proche, soit 569 $.
FLOOR(metric)
Supérieur à
Renvoie les éléments dont le nombre est supérieur à la valeur saisie.
Supérieur ou égal à
Renvoie les éléments dont le nombre est supérieur ou égal à la valeur saisie.
Cosinus hyperbolique (ligne)
Renvoie le cosinus hyperbolique d’un nombre.
COSH(metric)
Sinus hyperbolique (ligne)
Renvoie le sinus hyperbolique d’un nombre.
SINH(metric)
Tangente hyperbolique (ligne)
Renvoie la tangente hyperbolique d’un nombre.
TANH(metric)
IF (ligne)
La fonction IF renvoie une valeur si une condition que vous spécifiez est évaluée sur TRUE, et une autre valeur si cette condition est évaluée sur FALSE.
IF(logical_test, [value_if_true], [value_if_false])
Inférieur à
Renvoie les éléments dont le nombre est inférieur à la valeur saisie.
Inférieur ou égal à
Renvoie les éléments dont le nombre est inférieur ou égal à la valeur saisie.
Effet élévateur
Renvoie l’effet élévateur qu’une variante particulière avait dans les conversions sur une variante de contrôle. Il s’agit de la différence de performance entre une variante donnée et la ligne de base, divisée par les performances de la ligne de base, exprimée en pourcentage.
fx Lift (normalizing-container, success-metric, control)
Régression linéaire : coefficient de corrélation
Y = a X + b. Renvoie le coefficient de corrélation.
Régression linéaire : ordonnée à l’origine
Y = a X + b. Renvoie b.
Régression linéaire : Y prédit
Y = a X + b. Renvoie Y.
Régression linéaire : inclinaison
Y = a X + b. Renvoie a.
Logarithme de base 10 (ligne)
Renvoie le logarithme de base 10 d’un nombre.
LOG10(metric)
Régression logarithmique : coefficient de corrélation (tableau)
Renvoie le coefficient de corrélation, r, entre deux colonnes de mesures (metric_X et metric_Y) pour l’équation de régression Y = a ln(X) + b. Il est calculé en utilisant l’équation CORREL.
CORREL.LOG(metric_X,metric_Y)
Régression logarithmique : ordonnée à l’origine (tableau)
Renvoie l’ordonnée à l’origine b en tant que régression aux moindres carrés entre deux colonnes de mesures (metric_X et metric_Y) pour l’équation de régression Y = a ln(X) + b. Elle est calculée en utilisant l’équation INTERCEPT.
INTERCEPT.LOG(metric_X, metric_Y)
Régression logarithmique : Y prédit (ligne)
Calcule les valeurs y prédites (metric_Y), selon les valeurs x connues (metric_X) en utilisant la méthode des « moindres carrés » pour calculer la ligne de meilleure approximation d’après Y = a ln(X) + b. Elle est calculée en utilisant l’équation ESTIMATE.
Dans une analyse de régression, cette fonction calcule les valeurs y prédites (metric_Y), selon les valeurs x connues (metric_X) en utilisant l’algorithme pour calculer la ligne de meilleure approximation pour l’équation de régression Y = a ln(X) + b. Les valeurs a correspondent à chaque valeur x et b est une valeur constante.
ESTIMATE.LOG(metric_X, metric_Y)
Régression logarithmique : inclinaison (tableau)
Renvoie l’inclinaison, a, entre deux colonnes de mesures (metric_X et metric_Y) pour l’équation de régression Y = a ln(X) + b. Elle est calculée en utilisant l’équation SLOPE.
SLOPE.LOG(metric_A, metric_B)
Logarithme népérien
Renvoie le logarithme népérien d’un nombre. Les logarithmes népériens sont basés sur la constante e (2,71828182845904). LN est l’inverse de la fonction EXP.
LN(metric)
NOT
Renvoie 1 si le nombre est 0 ou renvoie 0 si autre nombre.
NOT(logical)
L’utilisation de NOT nécessite de connaître si les expressions (<, >, =, <> , etc.) renvoient la valeur 0 ou 1.
Différent de
Renvoie les éléments qui ne comportent pas une correspondance exacte avec la valeur saisie.
Ou (ligne)
Renvoie TRUE si un argument est TRUE ou renvoie FALSE si tous les arguments sont FALSE.
OR(logical_test1,[logical_test2],...)
Pi
Renvoie la constante PI, 3,14159265358979, exacte jusqu’à 15 chiffres.
PI()
La fonction PI ne comporte aucun argument.
Régression puissance : coefficient de corrélation (tableau)
Renvoie le coefficient de corrélation, r, entre deux colonnes de mesures (metric_X et metric_Y) pour Y = b*X.
CORREL.POWER(metric_X, metric_Y)
Régression puissance : ordonnée à l’origine (tableau)
Renvoie l’ordonnée à l’origine, b, entre deux colonnes de mesures (metric_X et metric_Y) pour Y = b*X.
INTERCEPT.POWER(metric_X, metric_Y)
Régression puissance : Y prédit (ligne)
Calcule les valeurs y prédites ( metric_Y), selon les valeurs x connues ( metric_X) en utilisant la méthode des « moindres carrés » pour calculer la ligne de meilleure approximation pour Y = b*X.
ESTIMATE.POWER(metric_X, metric_Y)
Régression puissance : inclinaison (tableau)
Renvoie l’inclinaison, a, entre deux colonnes de mesures (metric_X et metric_Y) pour Y = b*X.
SLOPE.POWER(metric_X, metric_Y)
Régression quadratique : coefficient de corrélation (tableau)
Renvoie le coefficient de corrélation, r, entre deux colonnes de mesures (metric_X et metric_Y) pour Y=(a*X+b) .
CORREL.QUADRATIC(metric_X, metric_Y)
Régression quadratique : ordonnée à l’origine (tableau)
Renvoie l’ordonnée à l’origine, b, entre deux colonnes de mesures (metric_X et metric_Y) pour Y=(a*X+b) .
INTERCEPT.POWER(metric_X, metric_Y)
Régression quadratique : Y prédit (ligne)
Calcule les valeurs y prédites (metric_Y), selon les valeurs x connues (metric_X) en utilisant la méthode des « moindres carrés » pour calculer la ligne de meilleure approximation en utilisant Y=(a*X+b) .
ESTIMATE.QUADRATIC(metric_A, metric_B)
Régression quadratique : inclinaison (tableau)
Renvoie l’inclinaison, a, entre deux colonnes de mesures (metric_X et metric_Y) pour Y=(a*X+b) .
SLOPE.QUADRATIC(metric_X, metric_Y)
Régression réciproque : coefficient de corrélation (tableau)
Renvoie le coefficient de corrélation r, entre deux colonnes de mesures (metric_X) et metric_Y) pour Y = a/X+b.
CORREL.RECIPROCAL(metric_X, metric_Y)
Régression réciproque : ordonnée à l’origine (tableau)
Renvoie l’ordonnée à l’origine, b, entre deux colonnes de mesures (metric_X et metric_Y) pour Y = a/X+b.
INTERCEPT.RECIPROCAL(metric_A, metric_B)
Régression réciproque : Y prédit (ligne)
Calcule les valeurs y prédites (metric_Y), selon les valeurs x connues (metric_X) en utilisant la méthode des « moindres carrés » pour calculer la ligne de meilleure approximation en utilisant Y = a/X+b.
ESTIMATE.RECIPROCAL(metric_X, metric_Y)
Régression réciproque : inclinaison (tableau)
Renvoie l’inclinaison, a, entre deux colonnes de mesures (metric_X et metric_Y) pour Y = a/X+b.
SLOPE.RECIPROCAL(metric_X, metric_Y)
Sinus (ligne)
Renvoie le sinus de l’angle donné. Si l’angle est en degrés, multipliez l’angle par PI( )/180.
SIN(metric)
Score normalisé
Alias de score centré réduit, soit l’écart par rapport à la moyenne divisé par l’écart type.
Test en t
Exécute un test en t m-latéral avec un score normalisé de col et n degrés de liberté.
La signature est t_test( x, n, m )
. En dessous, elle appelle simplement m*cdf_t(-abs(x),n)
. Cela est semblable à la fonction test en_z qui exécute m*cdf_z(-abs(x))
.
Ici, m
correspond au nombre de queues et n
, aux degrés de liberté. Il doit s’agir de nombres (c’est une constante pour l’ensemble du rapport ; en d’autres termes, cela ne doit pas changer d’une ligne à l’autre).
X
est la statistique du test en t. Il s’agira généralement d’une formule (zscore, par exemple) basée sur une mesure et évaluée sur chaque ligne.
La valeur renvoyée est la probabilité de voir la statistique de test x, étant donné les degrés de liberté et le nombre de queues.
Exemples :
-
Utilisez-la pour trouver des valeurs aberrantes :
code language-none t_test( zscore(bouncerate), row-count-1, 2)
-
Combinez-la à
if
pour ignorer les taux de rebond très élevés ou très bas, et comptabiliser les visites dans tous les autres cas :code language-none if ( t_test( z-score(bouncerate), row-count, 2) < 0.01, 0, visits )
Tangente
Renvoie la tangente de l’angle donné. Si l’angle est en degrés, multipliez l’angle par PI( )/180.
TAN (metric)
Score centré réduit (ligne)
Renvoie le score centré réduit, ou score normal, selon une distribution normale. Le score centré réduit est le nombre d’écarts types où une observation se trouve depuis la moyenne. Un score centré réduit de 0 (zéro) signifie que le score est le même que la moyenne. Un score centré réduit peut être positif ou négatif, indiquant s’il est au-dessus ou en-dessous de la moyenne et par quel nombre d’écarts types.
L’équation pour le score centré réduit est la suivante :
où x est le score brut, μ la moyenne de la population et σ l’écart type de la population.
Score centré réduit (mesure)
Test Z
Exécute un test Z n-latéral avec un score centré réduit de A.
Renvoie la probabilité que la ligne actuelle puisse être vue par hasard dans la colonne.