Erreur et puissance

M El Khebir
m.elkhebir@ch-beauvais.fr

Lorsque dans un essai ou une étude on compare 2 groupes de patients, qu’il s’agisse de l’exposition à un facteur de risque, d’un traitement ou d’un test diagnostic, on court le risque de se tromper, soit en concluant à tort à l’existence d’une différence qui en réalité n’existe pas, soit en concluant à l’absence de différence, qui en réalité existe. Les 2 erreurs sont des effets des fluctuations aléatoires d’échantillonnages, qui sont irréductibles, contrairement aux erreurs systématiques induites par les biais et qui, elles, peuvent être minimisées par le protocole expérimental.

On appelle risque alpha le risque de conclure à l’existence d’une différence qui n’existe pas en réalité: en thérapeutique, cela revient à considérer efficace un traitement qui ne l’est pas. On appelle risque béta le risque de conclure à l’absence de différence: en thérapeutique, cela revient à rejeter un traitement efficace. On peut aussi lire risque de 1ére espèce ou de type I, et risque de deuxième espèce ou de type II.

Devant le résultat d'un essai clinique on doit se demander si ce qu'on observe est réellement dû au traitement que l'on étudie (ça peut être aussi un test diagnostic ou une observation de cohorte) ou à la chance, du fait d'une erreur aléatoire lié à l'échantillonnage. C'est le test statistique qui va nous permettre de répondre. On pose une hypothèse: il n'y a pas de différence entre les 2 échantillons de l'essai: c'est l'hypothèse nulle, notée H0. On va appliquer le test statistique afin de valider ou de rejeter cette hypothèse. Là encore il y a risque d'erreur alpha et béta.

 

Décision/Réalité

H0 vraie

H0 fausse

Rejet H0

Risque alpha

Bonne décision

Non rejet de H0

Bonne décision

Risque beta

Le principe du test statistique est de permettre la quantification du risque d’erreur alpha: c’est le calcul de la p-valeur, ou p. On définit au préalable un seuil de risque, c’est le plus souvent et par convention la valeur 0,05 (ou 5%) qui est choisie.

Si à l’issue du test statistique le risque d’erreur alpha p est inférieur à 0,05, et si H0 est vraie, la probabilité d'obtenir ce résultat par hasard est inférieure à 5%, alors on peut raisonnablement rejeter l'hypothèse nulle et on peut conclure à l’existence d’une différence: on parle de significativité statistique. A l’inverse, si p est supérieur au seuil de 0,05, on ne peut rien en conclure, car la probabilité que la différence observée soit due au hasard est forte: soit il n’y a pas d’efficacité, soit l’essai manque de puissance.

Le risque d’erreur béta ne se calcule pas directement, on l'infère à partir du calcul de la puissance de l'essai:P=1-béta. Un essai suffisamment puissant a une forte probabilité d'obtenir un résultat significatif si le traitement a l’efficacité escomptée. Un essai insuffisamment puissant a une faible probabilité de mettre en évidence l'effet du traitement qui existe pourtant. La puissance augmente avec le nombre de sujet inclus dans l’étude, l’importance de l’effet recherché et la fréquence sans traitement de l’événement. On peut calculer à priori le nombre de patients nécessaires pour obtenir une puissance suffisante permettant de mettre en évidence l’effet recherché. En règle générale, on choisit un échantillon permettant d’avoir une puissance égale à 80% (d'où béta=20%).

Le degré de signification nous permet d’affirmer avec plus ou moins de conviction qu’il y a une différence, mais en aucun cas il ne nous renseigne sur l’importance de cette différence.

La signification statistique n’implique pas la pertinence clinique.

 

  1. spc.univ-lyon1.fr (site consulté le 09/05/2012)
  2. H.Motulsky, Biostatistique. Une approche intuitive.Edyion De Boeck (2002 pour la traduction française.
En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour réaliser des statistiques de visites.