Un intervalle de confiance à 95 % signifie-t-il qu’il y a 95 % de chances que la vraie valeur soit dans cet intervalle ?

Pas dans l’interprétation fréquentiste habituelle. Cela signifie que si le même processus d’échantillonnage était répété de nombreuses fois et qu’un intervalle était construit à chaque fois de la même manière, environ 95 % de ces intervalles contiendraient le vrai paramètre.

Quelle est la formule de base d’un intervalle de confiance ?

La structure générale est estimation $\\pm$ valeur critique $\\times$ erreur standard. La valeur critique exacte et l’erreur standard dépendent du paramètre et des hypothèses.

Intervalle de confiance — Formule, calcul et exemples

Un intervalle de confiance est une plage de valeurs plausibles pour un paramètre de population, à partir de données d’échantillon. Dans de nombreux exercices d’introduction aux statistiques, on le construit sous la forme

\text{estimate} \pm \text{margin of error}

La marge d’erreur dépend du niveau d’incertitude dans l’échantillon et du degré de confiance souhaité. Un niveau de confiance plus élevé donne un intervalle plus large. Des données plus précises donnent un intervalle plus étroit.

Ce que signifie un intervalle de confiance en langage simple

Si vous voyez un intervalle de confiance à $95\%$ , l’interprétation la plus sûre concerne la méthode, et non un intervalle unique déjà calculé. Si le même processus d’échantillonnage était répété de nombreuses fois et que l’intervalle était reconstruit de la même façon à chaque fois, environ $95\%$ de ces intervalles contiendraient le vrai paramètre.

Un intervalle de confiance est donc une manière de représenter l’incertitude autour d’une estimation. Il donne une plage plausible, pas une garantie.

Formule de l’intervalle de confiance

La structure générale est

\text{estimate} \pm \text{critical value} \times \text{standard error}

Pour une moyenne de population, deux versions courantes sont :

\bar{x} \pm z^* \frac{\sigma}{\sqrt{n}}

Utilisez cette forme lorsque l’écart-type de la population $\sigma$ est connu, ou lorsqu’une approximation normale avec une valeur critique de $z$ est justifiée.

\bar{x} \pm t^* \frac{s}{\sqrt{n}}

Utilisez cette forme lorsque $\sigma$ est inconnu et que vous estimez la dispersion avec l’écart-type de l’échantillon $s$ . Pour les petits échantillons, on l’emploie généralement avec la condition que la population soit approximativement normale.

Le même schéma apparaît dans de nombreuses situations, mais l’erreur standard change selon qu’il s’agit de moyennes, de proportions ou d’autres paramètres.

Ce qui modifie la largeur d’un intervalle de confiance

Trois facteurs comptent le plus :

Un niveau de confiance plus élevé rend l’intervalle plus large.
Une taille d’échantillon plus grande rend généralement l’intervalle plus étroit.
Une plus grande variabilité dans les données rend l’intervalle plus large.

C’est le compromis principal : plus de confiance coûte généralement en précision.

Exemple d’intervalle de confiance à 95 %

Supposons qu’un échantillon de $64$ observations ait pour moyenne $\bar{x} = 50$ , et que l’écart-type de la population soit connu et égal à $\sigma = 8$ . Construisez un intervalle de confiance à $95\%$ pour la moyenne de la population à l’aide d’un intervalle en $z$ .

Commencez par

\bar{x} \pm z^* \frac{\sigma}{\sqrt{n}}

Pour un niveau de confiance de $95\%$ , utilisez $z^* \approx 1.96$ .

Calculez maintenant l’erreur standard :

\frac{\sigma}{\sqrt{n}} = \frac{8}{\sqrt{64}} = \frac{8}{8} = 1

La marge d’erreur est donc

1.96 \times 1 = 1.96

Construisez l’intervalle :

50 \pm 1.96

ce qui donne

(48.04,\ 51.96)

En pratique, on peut l’interpréter ainsi : si les conditions du modèle sont raisonnables et que les données proviennent de ce processus d’échantillonnage, les valeurs comprises entre $48.04$ et $51.96$ sont plausibles pour la moyenne de la population.

Erreurs fréquentes avec les intervalles de confiance

Une erreur fréquente consiste à dire qu’il y a une probabilité de $95\%$ que le vrai paramètre se trouve dans cet intervalle précis. En statistique fréquentiste standard, le paramètre est fixe, et c’est la procédure de construction de l’intervalle qui possède un taux de réussite à long terme.

Une autre erreur consiste à utiliser la mauvaise formule sans vérifier les conditions. Un intervalle en $z$ , un intervalle en $t$ et un intervalle pour une proportion n’utilisent pas la même erreur standard.

Les étudiants confondent aussi un intervalle de confiance pour un paramètre avec la dispersion des données brutes. Un intervalle de confiance concerne l’incertitude d’une estimation, pas l’endroit où se situent la plupart des observations individuelles.

Quand les intervalles de confiance sont utilisés

Les intervalles de confiance apparaissent dans les sondages, les expériences, le contrôle qualité, la médecine, l’économie et les rapports de données du quotidien. Ils sont utiles chaque fois qu’un échantillon sert à dire quelque chose sur une population plus large.

En pratique, l’intervalle est surtout important lorsqu’on le compare à une valeur cible ou à une autre estimation. Un intervalle étroit permet une conclusion plus précise qu’un intervalle large.

Essayez un exercice similaire

Essayez votre propre version avec $\bar{x} = 72$ , $\sigma = 10$ et $n = 100$ pour un intervalle de confiance à $95\%$ . Ensuite, modifiez seulement la taille de l’échantillon et observez ce qui arrive à la marge d’erreur. C’est l’un des moyens les plus rapides de développer une intuition sur la raison pour laquelle des échantillons plus grands produisent généralement des intervalles plus resserrés.

Besoin d'aide pour un problème ?

Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.

Ouvrir GPAI Solver →