Analyse Kaplan-Meier
Principes de l’analyse Kaplan-Meier
La méthode de Kaplan-Meier permet d'obtenir rapidement une courbe de survie, ainsi que des statistiques essentielles comme le temps médian résiduel de survie. La méthode de Kaplan-Meier permet d'estimer les fonctions de survie, sans nécessiter que les intervalles de temps soient réguliers, contrairement à la méthode des tables actuarielles de survie. Les courbes de survie permettent d'analyser l'évolution de l'effectif d'une population donnée avec le temps.
Cette technique est utilisée pour l'analyse de données de survie, qu'il s'agisse d'individus (recherche sur le cancer par exemple), ou de produits (résistance au temps d'un outil de production par exemple) : certains individus meurent (les produits cassent), mais d'autres sortent de l'étude parce qu'ils guérissent, que l'on perd leur trace (déménagement par exemple) ou parce que l'étude est interrompue. Le premier type d'information est appelé « données événement », tandis que le second est appelé « données censurées ».
Exemples d’utilisation de l’analyse Kaplan-Meier
L’analyse de Kaplan-Meier permet aussi de comparer des populations, en s'appuyant sur leur courbe de survie. Par exemple, il peut être intéressant de comparer les temps de survie des hommes et des femmes face à une même maladie, ou de comparer les temps de casse pour un même produit fabriqué sur deux chaînes de production différentes.
Censure des données pour l’analyse Kaplan-Meier
Il existe plusieurs types de censure pour les données de survie :
- Censure à gauche : lorsqu'un événement est enregistré au temps t=t(i), cela signifie qu'il a eu lieu à t * t(i).
- Censure à droite : lorsqu'un événement est enregistré au temps t=t(i), cela signifie qu'il a eu lieu à t * t(i), s'il n'a jamais eu lieu.
- Censure par intervalle : lorsqu'un événement est enregistré au temps t=t(i), cela signifie qu'il a eu lieu pendant l'intervalle de temps [t(i-1); t(i)].
- Censure exacte : lorsqu'un événement est enregistré au temps t=t(i), cela signifie qu'il a eu lieu exactement à t=t(i).
L'utilisation de la méthode Kaplan-Meier implique que l'on fait l'hypothèse que les observations sont indépendantes. De même, on fait l'hypothèse que la censure est indépendante : soient deux individus pris au hasard, inclus dans l'étude au temps t-1 ; si l'un deux est censuré au temps t, alors leur chance de survie est égale au temps t. On distingue quatre types de censure indépendante :
- Type I simple : tous les individus sont censurés après une même durée.
- Type I progressif : tous les individus sont censurés à la même date, quelle que soit la durée pendant laquelle ils ont été suivis (fin de l'étude par exemple).
- Type II : les individus sont suivis jusqu'à ce que l'on ait observé n événements.
- Aléatoire : le temps auquel se produit une censure est indépendant du temps de survie.
Si les « données événement » sont souvent mesurées par intervalle ou à une date exacte, les « données censurées » sont quant à elles, en général censurées à droite, la censure étant indépendante et aléatoire.
Intervalle de confiance pour la fonction de survie
Le calcul des intervalles de confiance associés à a fonction de survie peut se faire de différentes manières.
- Méthode de Greenwood,
- Méthode exponentielle de Greenwood,
- Méthode du log-transformé.
Ces 3 méthodes donnent des résultats proches, mais on préférera les deux dernières dans le cas de petits échantillons.
Résultats pour l’analyse de Kaplan-Meier
Tableau de Kaplan-Meier
La table de survie issue de l’analyse de Kaplan-Meier est le principal résultat, il contient :
- Début de l'intervalle : borne inférieure de l'intervalle de temps.
- A risque : nombre d'individus à risque.
- Evénements : nombre d'événements enregistrés.
- Censurées : nombre de données censurées enregistrées.
- Proportion d'événements : proportion d'individus qui n'a pas survécu.
- Taux de survie : proportion d'individus qui a survécu.
- Fonction de survie (FSC) : probabilité pour un individu de survivre au moins jusqu'au temps considéré.
- Ecart-type de la fonction de survie.
- Intervalle de confiance de la fonction de survie.
Temps moyen et médian de survie
Dans un premier tableau sont affichés le temps moyen résiduel de survie et l'écart-type correspondant. Dans un second tableau sont affichés le temps résiduel pour trois quartiles au début de l'expérience. La médiane correspond au quartile 50%. Un intervalle de confiance sur ces statistiques est aussi fourni.
Graphiques pour l’analyse de Kaplan-Meier
Trois graphiques peuvent être affichés :
- Fonction de survie cumulée (FSC),
- -Log(FSC)
- et Log(-Log(FSC)).
Tests d'égalité des fonctions de survie
Les résultats des tests d'égalité des fonctions de survie sont affichés dans un tableau contenant les statistiques correspondant à trois tests :
- le test Log-rank,
- le test de Wilcoxon,
- et le test de Tarone Ware.
Ces tests utilisent la distribution du Khi². Plus la p-value est faible, plus la différence entre les courbes est significative.
analysez vos données avec xlstat
Inclus dans
Fonctionnalités corollaires