Test de Friedman-Rafsky
Utilisez ce test pour comparer les distributions de deux échantillons décrits par des données quantitatives. Cette méthode est disponible dans Excel via XLSTAT.
Qu'est-ce que le test de Friedman-Rafsky ?
Le test de Friedman-Rafsky est un test non-paramétrique sur deux échantillons X et Y. Ce test a pour hypothèse nulle :
H0 : X et Y ont la même fonction de distribution i.e. Fx = Fy.
Les tests non-paramétriques ne se basent pas sur des distributions statistiques. Ils peuvent donc être utilisés même si les conditions de validité des tests paramétriques ne sont pas vérifiées. Consultez notre guide pour en savoir plus sur les différences entre les tests paramétriques et non paramétriques.
Si vous n'êtes pas sûr du test que vous devez utiliser, lisez notre guide sur le choix du test approprié en fonction de la situation.
Comment configurer un test de Friedman-Rafsky dans XLSTAT ?
La boîte de dialogue XLSTAT du test de Friedman-Rafsky est divisée en plusieurs onglets qui correspondent à une variété d'options, allant de la sélection des données à l'affichage des résultats. Les options principales sont :
Format des données :
- Échantillons séparés : activez cette option pour sélectionner deux tableaux (un échantillon de taille m et un deuxième de taille n) qui peuvent avoir un nombre de lignes différent mais en veillant à ce qu'ils aient le même nombre p de colonnes.
- Échantillons regroupés : sélectionnez un tableau comprenant m+n observations avec pp variables quantitatives. Un identifiant (binaire) d'échantillon permettant d'affecter chaque observation à un échantillon doit par ailleurs être sélectionné.
Distance : cette option vous permet de sélectionner le calcul de distance que vous souhaitez utiliser suivant le type des variables :
- distance euclidienne ;
- distance de Manhattan ;
- distance de Chebychev ;
- distance de Canberra.
Arbre couvrant minimum / Algorithme :
Cette option vous permet de choisir entre trois méthodes pour construire l'arbre couvrant minimum :
- Chazelle (Soft-Heap) (par défaut) : cet algorithme est un algorithme déterministe et possède jusqu'à présent la plus petite complexité pour construire un arbre couvrant minimum.
- Kruskal : l'algorithme de Kruskal est un des algorithmes les plus utilisés pour construire un arbre couvrant minimum. C'est un algorithme glouton qui est à privilégier pour des petits échantillons.
- Boruvka : il s'agit du premier algorithme inventé pour la construction d'un arbre couvrant minimum. C'est également un algorithme glouton.
Quels sont les résultats du test de Friedman-Rafsky dans XLSTAT ?
Statistiques descriptives : le tableau des statistiques descriptives présente des statistiques simples pour les données sélectionnées. Le nombre d'observations par variable et par échantillon, le minimum, le maximum, les différents quartiles, la moyenne, la variance et l'écart-type sont affichés.
Résultats associés au test de Friedman-Rafsky : le tableau montre les résultats détaillés du test, comme la valeur de la statistique W.
Résultats associés à l'arbre minimum couvrant : ce tableau comprend quatre colonnes qui informent sur : les arêtes de l'arbre, les deux nœuds qu'il relie, le poids (la distance entre les deux nœuds) et si les nœuds proviennent du même échantillon.
Résultat associé à la matrice de distance : dans ce tableau sont affichées les dissimilarités entre les objets des deux échantillons pour la distance choisie.
Tutoriel sur le test de Friedman-Rafsky dans XLSTAT
Un exemple est disponible sur le centre d'aide de XLSTAT montrant comment mettre en place un test de Friedman-Rafsky dans XLSTAT et comment interpréter ses résultats.
analysez vos données avec xlstat
Fonctionnalités corollaires