Etape 2 : Prévoir un peu plus de 10 minutes d'intention dirigée vers le pôle A
- p-valeur :
- Indique la probabilité d'obtenir des résultats au moins aussi extrêmes que ceux observés, si seul le hasard était en jeu (hypothèse nulle : 50 % de succès).
- Si p < 0.05 : Le résultat est statistiquement significatif. Il est peu probable que l'écart observé par rapport à 50 % soit dû uniquement au hasard. Cela suggère un effet réel.
- Si p ≥ 0.05 : Le résultat n'est pas statistiquement significatif. On ne peut pas exclure que le hasard seul explique l'écart observé. L'expérience est non concluante sur l'existence d'un effet.
- La p-valeur ne mesure pas la probabilité que l'effet soit réel ou que l’hypothèse nulle soit vraie, mais uniquement la probabilité d’observer un tel résultat (ou plus extrême) sous l’hypothèse nulle.
- Taille d'effet (d de Cohen) :
- Mesure l'ampleur de l'écart observé par rapport à une distribution parfaitement aléatoire (50 %). Contrairement à la p-valeur, elle n'est pas directement influencée par la durée de la simulation (nombre d'essais).
- Elle est qualifiée de très faible à forte pour donner une idée pratique de l'importance de l'effet détecté. Elle est classée selon des seuils usuels (0.1 très faible, 0.2 faible, 0.5 moyen, 0.8 fort).
- Puissance statistique (calculée post-hoc) :
- N'est pertinente et calculée que si le pôle A a plus de 50 % de succès.
- Elle estime la probabilité que cette simulation, avec sa durée et l'effet observé, aurait eu de détecter un effet statistiquement significatif (p < 0.05), si l'effet observé correspondait à un effet réel de cette magnitude.
- Si puissance < 80 % : La simulation avait une faible probabilité de détecter un effet de la taille observée, même s'il était réel. Un résultat non significatif (p ≥ 0.05) pourrait être dû à un manque de données (simulation trop courte).
- Si puissance ≥ 80 % : La simulation avait une bonne sensibilité pour détecter un effet de la taille observée. Si le résultat est significatif (p < 0.05), on peut avoir davantage confiance dans la conclusion. Si le résultat n'est pas significatif malgré une puissance élevée, cela renforce l'idée d'une absence d'effet notable.
- Le calcul de puissance post-hoc est controversé (il est conditionné par l’effet observé, donc potentiellement biaisé), mais dans ce cadre expérimental répétitif, il peut tout à fait avoir une valeur exploratoire utile.
Vous souhaitez nous parler de votre expérience ? Vous voulez mener une expérience semblable à l'IMI avec un robot réel et un tirage aléatoire physique ? Ecrivez-nous !
Complément : Le système était-il bien aléatoire à la base ? Vérifions-le par la simulation suivante...