Multidimensional Scaling (MDS)
Le Multidimensional Scaling (MDS) permet de visualiser une matrice de proximité. MDS et NMDS sont disponibles dans Excel grâce au logiciel de statistique XLSTAT.
Qu’est-ce que le Multidimensional Scaling ?
Le Multidimensional Scaling (MDS) permet de passer d'une matrice de proximité (similarité ou dissimilarité) entre une série de N objets aux coordonnées de ces mêmes objets dans un espace à p dimensions. On fixera en général p à 2 ou 3 afin de pouvoir facilement visualiser les objets. Par exemple, avec le MDS, il est possible de reconstituer très précisément la position de villes sur une carte à partir des distances kilométriques (la dissimilarité est alors une distance euclidienne) entre les villes, à une rotation et une symétrie près.
L'exemple ci-dessus a pour seul intérêt de montrer la performance de la méthode, et de faire comprendre son esprit. Dans la pratique, le MDS est souvent utilisé en psychométrie (analyse de perceptions) et en marketing (distances entre produits obtenus à partir de classements par des consommateurs), mais on trouve des applications dans de très nombreux domaines.
Type de Multidimensional Scaling : MDS et NMDS
Il existe deux types de MDS en fonction de la nature de la dissimilarité observée: MDS métrique et MDS non-métrique ou NMDS. Toutes les options qui suivent sont disponibles dans XLSTAT :
MDS métrique
Avec le MDS métrique, les dissimilarités sont considérées comme continues et donnant une information exacte à reproduire le plus fidèlement possible. Quatre sous-modèles sont proposés dans XLSTAT :
- Absolu (absolute MDS) : les distances obtenues dans l'espace de représentation doivent correspondre le plus fidèlement possible aux distances observées dans la matrice de dissimilarité initiale.
- Rapport (ratio MDS) : les distances obtenues dans l'espace de représentation doivent correspondre le plus fidèlement possible aux distances observées dans la matrice initiale, à un facteur de proportionnalité près (le facteur étant identique pour tous les couples de distances).
- Intervalle (interval MDS) : les distances obtenues dans l'espace de représentation doivent correspondre le plus fidèlement possible aux distances observées dans la matrice initiale, à une relation linéaire près (la relation linéaire facteur étant identique pour tous les couples de distances).
- Polynomial (polynomial MDS) : les distances obtenues dans l'espace de représentation doivent correspondre le plus fidèlement possible aux distances observées dans la matrice initiale, à une relation polynomiale de degré deux près (la relation linéaire facteur étant identique pour tous les couples de distances).
Remarque : le modèle absolu permet de comparer les distances dans l'espace de représentation à celles de l'espace de départ. Les autres modèles présentent l'avantage d'accélérer les calculs.
MDS non métrique ou NMDS
Avec le MDS non-métrique ou NMDS, seul compte l'ordre entre les dissimilarités. Autrement dit l'algorithme MDS ne doit pas essayer de reproduire les dissimilarités, mais seulement la relation d'ordre entre ces dernières. Deux modèles sont possibles dans XLSTAT :
- Ordinal (1) : la relation d'ordre entre les distances dans l'espace de représentation doit correspondre à celle des dissimilarités correspondantes. En cas de dissimilarités de même rang, aucune restriction n'est imposée sur les distances correspondantes. Autrement dit, des dissimilarités de même rang ne doivent pas nécessairement donner des distances égales dans l'espace de représentation.
- Ordinal (2) : la relation d'ordre entre les distances dans l'espace de représentation doit correspondre à celle des dissimilarités correspondantes. En cas de dissimilarités de même rang, les distances correspondantes doivent être égales.
XLSTAT utilise l'algorithme SMACOF (Scaling by MAjorizing a COnvex Function) qui minimise le Stress standardisé (de Leeuw, 1977).
Remarque : pour un nombre de dimensions donné, plus faible est le stress, meilleure est la qualité de la représentation. Par ailleurs, plus le nombre de dimensions est élevé, plus le stress est faible.
Résultats pour le Multidimensional Scaling dans XLSTAT
- Stress après minimisation : ce tableau permet de visualiser pour les dimensions étudiées le stress final obtenu, le nombre d'itérations nécessaire et le niveau de convergence atteint. Dans le cas où plusieurs dimensions sont étudiées, un graphique d'évolution du stress en fonction du nombre de dimensions est affiché.
Les résultats qui suivent sont affichés pour chacune des dimensions étudiées
- Distances mesurées dans l'espace de représentation : ce tableau correspond aux distances entre les objets dans l'espace de représentation.
- Disparités calculées d'après le modèle : ce tableau fournit les disparités calculées à partir du modèle choisi (absolu, intervalle, …).
- Distances résiduelles : ces distances sont la différence entre les dissimilarités de la matrice initiale, et les distances mesurées dans l'espace de représentation.
- Tableau de comparaison : ce tableau permet de comparer les dissimilarités, les disparités et les distances, ainsi que les rangs de ces trois mesures pour l'ensemble des combinaisons deux à deux d'objets.
Graphiques pour le Multidimensional Scaling dans XLSTAT
- Diagramme de Shepard : ce graphique permet de comparer les disparités et les distances aux dissimilarités. Dans le cas d'un modèle métrique, la représentation est d'autant meilleure que les points sont confondus avec la première bissectrice du plan. Dans le cas d'un modèle non métrique, le modèle est d'autant meilleur que la ligne des dissimilarités/disparités croît régulièrement. Par ailleurs la performance du modèle peut-être évaluée en observant si les points (dissimilarité/distance) sont proches des points (dissimilarité/disparité).
- Configuration MDS : dans ce tableau sont affichées les coordonnées des objets dans l'espace de représentation. Si l'espace est à deux dimensions, une représentation graphique de la configuration est fournie. Si vous disposez de l'outil XLSTAT-3DPlot, vous pouvez aussi visualiser une configuration en trois dimensions.
Tutoriel MDS dans XLSTAT
Ce tutoriel vous aidera à configurer et à interpréter un Scaling Multidimensionel ou MDS dans Excel avec XLSTAT.
analysez vos données avec xlstat
Fonctionnalités corollaires