Un intervalle de confiance est une plage de valeurs plausibles pour un paramètre de population, à partir de données d’échantillon. Dans de nombreux exercices d’introduction aux statistiques, on le construit sous la forme
La marge d’erreur dépend du niveau d’incertitude dans l’échantillon et du degré de confiance souhaité. Un niveau de confiance plus élevé donne un intervalle plus large. Des données plus précises donnent un intervalle plus étroit.
Ce que signifie un intervalle de confiance en langage simple
Si vous voyez un intervalle de confiance à , l’interprétation la plus sûre concerne la méthode, et non un intervalle unique déjà calculé. Si le même processus d’échantillonnage était répété de nombreuses fois et que l’intervalle était reconstruit de la même façon à chaque fois, environ de ces intervalles contiendraient le vrai paramètre.
Un intervalle de confiance est donc une manière de représenter l’incertitude autour d’une estimation. Il donne une plage plausible, pas une garantie.
Formule de l’intervalle de confiance
La structure générale est
Pour une moyenne de population, deux versions courantes sont :
Utilisez cette forme lorsque l’écart-type de la population est connu, ou lorsqu’une approximation normale avec une valeur critique de est justifiée.
Utilisez cette forme lorsque est inconnu et que vous estimez la dispersion avec l’écart-type de l’échantillon . Pour les petits échantillons, on l’emploie généralement avec la condition que la population soit approximativement normale.
Le même schéma apparaît dans de nombreuses situations, mais l’erreur standard change selon qu’il s’agit de moyennes, de proportions ou d’autres paramètres.
Ce qui modifie la largeur d’un intervalle de confiance
Trois facteurs comptent le plus :
- Un niveau de confiance plus élevé rend l’intervalle plus large.
- Une taille d’échantillon plus grande rend généralement l’intervalle plus étroit.
- Une plus grande variabilité dans les données rend l’intervalle plus large.
C’est le compromis principal : plus de confiance coûte généralement en précision.
Exemple d’intervalle de confiance à 95 %
Supposons qu’un échantillon de observations ait pour moyenne , et que l’écart-type de la population soit connu et égal à . Construisez un intervalle de confiance à pour la moyenne de la population à l’aide d’un intervalle en .
Commencez par
Pour un niveau de confiance de , utilisez .
Calculez maintenant l’erreur standard :
La marge d’erreur est donc
Construisez l’intervalle :
ce qui donne
En pratique, on peut l’interpréter ainsi : si les conditions du modèle sont raisonnables et que les données proviennent de ce processus d’échantillonnage, les valeurs comprises entre et sont plausibles pour la moyenne de la population.
Erreurs fréquentes avec les intervalles de confiance
Une erreur fréquente consiste à dire qu’il y a une probabilité de que le vrai paramètre se trouve dans cet intervalle précis. En statistique fréquentiste standard, le paramètre est fixe, et c’est la procédure de construction de l’intervalle qui possède un taux de réussite à long terme.
Une autre erreur consiste à utiliser la mauvaise formule sans vérifier les conditions. Un intervalle en , un intervalle en et un intervalle pour une proportion n’utilisent pas la même erreur standard.
Les étudiants confondent aussi un intervalle de confiance pour un paramètre avec la dispersion des données brutes. Un intervalle de confiance concerne l’incertitude d’une estimation, pas l’endroit où se situent la plupart des observations individuelles.
Quand les intervalles de confiance sont utilisés
Les intervalles de confiance apparaissent dans les sondages, les expériences, le contrôle qualité, la médecine, l’économie et les rapports de données du quotidien. Ils sont utiles chaque fois qu’un échantillon sert à dire quelque chose sur une population plus large.
En pratique, l’intervalle est surtout important lorsqu’on le compare à une valeur cible ou à une autre estimation. Un intervalle étroit permet une conclusion plus précise qu’un intervalle large.
Essayez un exercice similaire
Essayez votre propre version avec , et pour un intervalle de confiance à . Ensuite, modifiez seulement la taille de l’échantillon et observez ce qui arrive à la marge d’erreur. C’est l’un des moyens les plus rapides de développer une intuition sur la raison pour laquelle des échantillons plus grands produisent généralement des intervalles plus resserrés.
Besoin d'aide pour un problème ?
Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.
Ouvrir GPAI Solver →