Puissance statistique pour les tests de comparaison des corrélations

power-compare-correlations-general-dialog-box.png

Puissance statistique d’un test de comparaison de corrélation

XLSTAT propose un test afin de comparer des corrélations. XLSTAT permet de calculer la puissance ou le nombre d'observations nécessaire pour ce test.

Lorsqu'on teste une hypothèse à l'aide d'un test statistique, on a plusieurs éléments à choisir :

  • L'hypothèse nulle H0 et l'hypothèse alternative Ha.
  • Le test statistique à utiliser
  • L'erreur de première espèce (erreur de type I) que l'on appelle aussi alpha. Elle se produit lorsqu'on rejette l'hypothèse nulle alors qu'elle est vraie. Elle est fixée a priori pour chaque test et vaut 5%.

L'erreur de seconde espèce ou beta est moins étudiée mais elle revêt une grande importance. En effet, elle représente la probabilité que l'on ne rejette pas l'hypothèse nulle alors qu'elle est fausse. On ne peut pas la fixer a priori mais, on peut essayer de la minimiser, en jouant sur les autres paramètres du modèle. La puissance d'un test est calculée comme 1-beta et représente la probabilité que l'on rejette l'hypothèse nulle alors qu'elle est bien fausse. On voudra donc maximiser la puissance du test. XLSTAT permet de calculer cette puissance (ainsi que beta) lorsque les autres paramètres du test sont connus. D'autre part, il permet pour une puissance donnée d'évaluer la taille de l'échantillon nécessaire à l'obtention de cette puissance.

Les calculs de puissance en statistique se font généralement avant que l'expérience ne soit menée. On s'en sert principalement pour estimer le nombre d'observations nécessaire pour que l'expérience ait la qualité statistique requise.

XLSTAT permet donc de comparer :

  • Une corrélation à 0
  • Une corrélation à une constante
  • Deux corrélations

Calcul de la puissance d’un test de comparaison des corrélations

La puissance d'un test est généralement obtenue à l'aide de la distribution non centrale associée. Dans notre cas, nous utiliserons la distribution non centrale de Student ou des approximations en utilisant la loi normale.

Puissance pour un test de comparaison d'une corrélation à 0

L'hypothèse alternative est dans ce cas : H a: r ≠ 0 La méthode utilisée est une méthode exacte basée sur la distribution non centrale de Student. Le paramètre de non centralité utilisé est le suivant : NCP = √ r²/(1-r²)* √N

La partie r²/(1-r²) est appelé taille de l'effet (effect size), il arrive que l'on fasse varier celle-ci.

Puissance pour un test de comparaison d'une corrélation à une constante

L'hypothèse alternative est dans ce cas : Ha: r ≠ r0. Le calcul de la puissance se fait en utilisant une approximation par la loi normale. On utilise la transformation Z de Fisher : Zr = ½ log[(1+r)/(1-r)]. On prend comme taille de l'effet : Q = |Zr - Zr0|. La puissance est alors trouvée en utilisant l'aire sous la courbe de la distribution normale à gauche de Zp: Zp = Q * √N - 3 - Zreq.

Avec Zreq le quantile de la distribution normale pour un alpha fixé.

Puissance pour un test de comparaison de deux corrélations

L'hypothèse alternative est dans ce cas : Ha: r1 – r2 ≠ 0. Le calcul de la puissance se fait en utilisant une approximation par la loi normale. On utilise la transformation Z de Fisher : Zr = ½ log[(1+r)/(1-r)].

On prend comme effet : Q = |Zr1 - Zr2|.

La puissance est alors trouvée en utilisant l'aire sous la courbe de la distribution normale à gauche de Zp: Zp = Q * √(N’ – 3)/2 - Zreq Avec Zreq le quantile de la distribution normale pour un alpha fixé et N’ = [2*(N1 - 3)*(N2 - 3)]/[N1 + N2 - 6] + 3.

Calcul de la taille de l'échantillon à partir de la puissance statistique

Afin de calculer le nombre d'observations nécessaires, XLSTAT utilise un algorithme de recherche de racine d'une fonction appelé algorithme Van Wijngaarden-Dekker-Brent (Brent, 1973). Cet algorithme est adapté au cas où les dérivées de la fonction ne sont pas connues. On cherche ainsi N tel que

puissance_test(N)-puissance_recherchée=0

On obtient donc la taille N telle que la puissance soit la plus proche possible de la puissance recherchée.

Taille de l'effet (effect size) pour un test de corrélation

Ce concept est très important dans les calculs de puissance. En effet, Cohen (1988) a développé ce concept qui va permettre de s'affranchir d'entrer tous les paramètres du modèle (qui sont d'ailleurs souvent inconnus). La taille de l'effet est une grandeur qui va permettre de calculer la puissance d'un test sans entrer tous les paramètres mais qui permettra de dire si l'effet des paramètres à tester est faible ou fort.

Dans le cadre des comparaisons de corrélations, les conventions de grandeurs de la taille de l'effet q sont :

  • Q=0,1, l'effet est faible.
  • Q=0,3, l'effet est modéré.
  • Q=0,5, l'effet est fort.

XLSTAT permet d'entrer directement la taille de l'effet.

ternary diagramneural network diagram

analysez vos données avec xlstat

essayez gratuitement pendant 14 jours