Un intervalle de confiance est une plage de valeurs plausibles pour un paramètre de population, à partir de données d’échantillon. Dans de nombreux exercices d’introduction aux statistiques, on le construit sous la forme

estimate±margin of error\text{estimate} \pm \text{margin of error}

La marge d’erreur dépend du niveau d’incertitude dans l’échantillon et du degré de confiance souhaité. Un niveau de confiance plus élevé donne un intervalle plus large. Des données plus précises donnent un intervalle plus étroit.

Ce que signifie un intervalle de confiance en langage simple

Si vous voyez un intervalle de confiance à 95%95\%, l’interprétation la plus sûre concerne la méthode, et non un intervalle unique déjà calculé. Si le même processus d’échantillonnage était répété de nombreuses fois et que l’intervalle était reconstruit de la même façon à chaque fois, environ 95%95\% de ces intervalles contiendraient le vrai paramètre.

Un intervalle de confiance est donc une manière de représenter l’incertitude autour d’une estimation. Il donne une plage plausible, pas une garantie.

Formule de l’intervalle de confiance

La structure générale est

estimate±critical value×standard error\text{estimate} \pm \text{critical value} \times \text{standard error}

Pour une moyenne de population, deux versions courantes sont :

xˉ±zσn\bar{x} \pm z^* \frac{\sigma}{\sqrt{n}}

Utilisez cette forme lorsque l’écart-type de la population σ\sigma est connu, ou lorsqu’une approximation normale avec une valeur critique de zz est justifiée.

xˉ±tsn\bar{x} \pm t^* \frac{s}{\sqrt{n}}

Utilisez cette forme lorsque σ\sigma est inconnu et que vous estimez la dispersion avec l’écart-type de l’échantillon ss. Pour les petits échantillons, on l’emploie généralement avec la condition que la population soit approximativement normale.

Le même schéma apparaît dans de nombreuses situations, mais l’erreur standard change selon qu’il s’agit de moyennes, de proportions ou d’autres paramètres.

Ce qui modifie la largeur d’un intervalle de confiance

Trois facteurs comptent le plus :

  1. Un niveau de confiance plus élevé rend l’intervalle plus large.
  2. Une taille d’échantillon plus grande rend généralement l’intervalle plus étroit.
  3. Une plus grande variabilité dans les données rend l’intervalle plus large.

C’est le compromis principal : plus de confiance coûte généralement en précision.

Exemple d’intervalle de confiance à 95 %

Supposons qu’un échantillon de 6464 observations ait pour moyenne xˉ=50\bar{x} = 50, et que l’écart-type de la population soit connu et égal à σ=8\sigma = 8. Construisez un intervalle de confiance à 95%95\% pour la moyenne de la population à l’aide d’un intervalle en zz.

Commencez par

xˉ±zσn\bar{x} \pm z^* \frac{\sigma}{\sqrt{n}}

Pour un niveau de confiance de 95%95\%, utilisez z1.96z^* \approx 1.96.

Calculez maintenant l’erreur standard :

σn=864=88=1\frac{\sigma}{\sqrt{n}} = \frac{8}{\sqrt{64}} = \frac{8}{8} = 1

La marge d’erreur est donc

1.96×1=1.961.96 \times 1 = 1.96

Construisez l’intervalle :

50±1.9650 \pm 1.96

ce qui donne

(48.04, 51.96)(48.04,\ 51.96)

En pratique, on peut l’interpréter ainsi : si les conditions du modèle sont raisonnables et que les données proviennent de ce processus d’échantillonnage, les valeurs comprises entre 48.0448.04 et 51.9651.96 sont plausibles pour la moyenne de la population.

Erreurs fréquentes avec les intervalles de confiance

Une erreur fréquente consiste à dire qu’il y a une probabilité de 95%95\% que le vrai paramètre se trouve dans cet intervalle précis. En statistique fréquentiste standard, le paramètre est fixe, et c’est la procédure de construction de l’intervalle qui possède un taux de réussite à long terme.

Une autre erreur consiste à utiliser la mauvaise formule sans vérifier les conditions. Un intervalle en zz, un intervalle en tt et un intervalle pour une proportion n’utilisent pas la même erreur standard.

Les étudiants confondent aussi un intervalle de confiance pour un paramètre avec la dispersion des données brutes. Un intervalle de confiance concerne l’incertitude d’une estimation, pas l’endroit où se situent la plupart des observations individuelles.

Quand les intervalles de confiance sont utilisés

Les intervalles de confiance apparaissent dans les sondages, les expériences, le contrôle qualité, la médecine, l’économie et les rapports de données du quotidien. Ils sont utiles chaque fois qu’un échantillon sert à dire quelque chose sur une population plus large.

En pratique, l’intervalle est surtout important lorsqu’on le compare à une valeur cible ou à une autre estimation. Un intervalle étroit permet une conclusion plus précise qu’un intervalle large.

Essayez un exercice similaire

Essayez votre propre version avec xˉ=72\bar{x} = 72, σ=10\sigma = 10 et n=100n = 100 pour un intervalle de confiance à 95%95\%. Ensuite, modifiez seulement la taille de l’échantillon et observez ce qui arrive à la marge d’erreur. C’est l’un des moyens les plus rapides de développer une intuition sur la raison pour laquelle des échantillons plus grands produisent généralement des intervalles plus resserrés.

Besoin d'aide pour un problème ?

Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.

Ouvrir GPAI Solver →