[ retour | courbe ROC avec une loi lognormale | source ]

les courbes ROC (Receiver Operating Characteristic)

Les fonctions f et g représentent les distributions respectives d'une certaine hormone ou d'un paramètre d'une analyse de sang chez des personnes atteintes d'une certaine maladie et chez des personnes non malades.
On mesure le taux de cette hormone chez un patient et on le compare à un certain seuil x fixé à l'avance.
Ce taux étant plutôt supérieur chez les malades, il est naturel d'annoncer que le test est positif si le résultat est supérieur à x et qu'il est négatif dans le cas contraire.
Problème : où placer x ?
En effet augmenter x revient à diminuer l'aire de couleur cyan. Cette aire est la probabilité d'avoir un test positif sachant que l'on n'est pas malade. Il faut qu'elle soit la plus petite possible. Le complément à 1 de cette probabilité est appelé spécificité.
Mais la réduction de l'aire de couleur cyan entraîne aussi celle de couleur jaune. Comme cette dernière est la probabilité pour que le test soit positif sachant que l'on est malade. C'est la sensibilité. On a intérêt à ce que la sensibilité soit la plus grande possible.
Donc on retiendra que, plus x augmente, plus la spécificité augmente, ce qui est bien, mais plus la sensibilité diminue et ça c'est moins bien !
Tracer une courbe ROC consiste à représenter pour chaque valeur de x un point dont l'abscisse est le complément à 1 de la spécificité et l'ordonnée la sensibilité.
En d'autes termes cette courbe représente la probabilité d'avoir raison en affirmant que la personne est malade en fonction de la probabilité d'affirmer à tord que la personne est malade.

Modifier la seconde distribution et observer la courbe ROC.
Comment est la courbe ROC lorsque les distributions des deux populations, malades et non-malades sont identiques ?
Comment est la courbe ROC lorsque les distributions sont très différentes ?
Ou placer x dans les deux cas ?
Remarque : dans l'animation ci-dessus, les lois sont normales.