[ retour | courbe ROC avec une loi lognormale | source ]
les courbes ROC (Receiver Operating Characteristic)
Les fonctions f et g représentent les distributions respectives d'une
certaine hormone ou d'un paramètre d'une analyse de sang chez des personnes
atteintes d'une certaine maladie et chez des personnes non malades.
On mesure le taux de cette hormone chez un patient et on le compare à
un certain seuil x fixé à l'avance.
Ce taux étant plutôt supérieur chez les malades, il est
naturel d'annoncer que le test est positif si le résultat est supérieur
à x et qu'il est négatif dans le cas contraire.
Problème : où placer x ?
En effet augmenter x revient à diminuer l'aire de couleur cyan. Cette
aire est la probabilité d'avoir un test positif sachant que l'on n'est
pas malade. Il faut qu'elle soit la plus petite possible. Le complément
à 1 de cette probabilité est appelé spécificité.
Mais la réduction de l'aire de couleur cyan entraîne aussi celle
de couleur jaune. Comme cette dernière est la probabilité pour
que le test soit positif sachant que l'on est malade. C'est la sensibilité.
On a intérêt à ce que la sensibilité soit la plus
grande possible.
Donc on retiendra que, plus x augmente, plus la spécificité augmente,
ce qui est bien, mais plus la sensibilité diminue et ça c'est
moins bien !
Tracer une courbe ROC consiste à représenter pour chaque valeur
de x un point dont l'abscisse est le complément à 1 de la spécificité
et l'ordonnée la sensibilité.
En d'autes termes cette courbe représente la probabilité d'avoir
raison en affirmant que la personne est malade en fonction de la probabilité
d'affirmer à tord que la personne est malade.
Modifier la seconde distribution et observer la courbe ROC.
Comment est la courbe ROC lorsque les distributions des deux populations, malades
et non-malades sont identiques ?
Comment est la courbe ROC lorsque les distributions sont très différentes ?
Ou placer x dans les deux cas ?
Remarque : dans l'animation ci-dessus, les lois sont normales.