Erreur standard — formule, signification et différence avec l’écart-type

L’erreur standard indique de combien une estimation obtenue à partir d’un échantillon varierait habituellement d’un échantillon aléatoire à un autre. Sur cette page, cette estimation est la moyenne d’échantillon. Elle mesure la variation d’échantillonnage typique de la moyenne, et non la dispersion des données brutes.

Pour la moyenne d’échantillon, l’erreur standard est

SE(\bar{x}) = \frac{\sigma}{\sqrt{n}}

si l’écart-type de la population $\sigma$ est connu. En pratique, $\sigma$ est souvent inconnu, donc on l’estime avec l’écart-type de l’échantillon $s$ :

SE(\bar{x}) \approx \frac{s}{\sqrt{n}}

Cette formule s’applique à la moyenne dans le cadre habituel : les observations sont traitées comme un échantillon aléatoire indépendant, et l’on s’intéresse à la précision de la moyenne d’échantillon. Une erreur standard plus petite signifie une estimation plus précise.

Ce que mesure réellement l’erreur standard

L’erreur standard concerne une estimation, pas les observations individuelles. Si vous continuiez à prélever de nouveaux échantillons de même taille dans la même population, la moyenne d’échantillon varierait. L’erreur standard décrit l’ampleur typique de cette variation.

C’est pourquoi l’erreur standard diminue quand $n$ augmente. Faire la moyenne d’un plus grand nombre d’observations rend généralement la moyenne d’échantillon plus stable d’un échantillon à l’autre, à condition que le processus de collecte des données reste comparable.

Erreur standard vs écart-type

C’est cette distinction qui crée le plus de confusion. L’écart-type décrit à quel point les valeurs sont dispersées à l’intérieur d’un seul jeu de données. L’erreur standard décrit à quel point une statistique, comme la moyenne d’échantillon, serait dispersée sur de nombreux échantillons répétés.

Pour la moyenne, les deux sont reliés par

SE(\bar{x}) \approx \frac{s}{\sqrt{n}}

lorsqu’on estime à partir d’un échantillon. Donc l’erreur standard utilise l’écart-type, mais elles répondent à des questions différentes.

Retenez ce raccourci :

L’écart-type demande : « À quel point les valeurs sont-elles dispersées ? »
L’erreur standard demande : « À quel point ma moyenne d’échantillon est-elle précise comme estimation ? »

Un exemple détaillé d’erreur standard

Supposons qu’un échantillon de $n = 25$ élèves ait une note moyenne de $78$ et un écart-type d’échantillon de $10$ .

L’erreur standard estimée de la moyenne est

SE(\bar{x}) \approx \frac{s}{\sqrt{n}} = \frac{10}{\sqrt{25}} = \frac{10}{5} = 2

Le point essentiel est l’interprétation. La valeur $2$ ne signifie pas que la plupart des élèves se trouvent à moins de $2$ points de $78$ . Ce serait confondre l’erreur standard avec l’écart-type.

Cela signifie plutôt que, si l’on prélevait de façon répétée des échantillons aléatoires similaires de $25$ élèves dans la même population, la moyenne d’échantillon varierait typiquement d’environ $2$ points d’un échantillon à l’autre.

Pourquoi la formule utilise $\sqrt{n}$

Le $\sqrt{n}$ au dénominateur explique pourquoi des échantillons plus grands donnent des estimations plus précises de la moyenne. Si la taille de l’échantillon augmente, le dénominateur augmente aussi, donc l’erreur standard diminue.

Mais le changement n’est pas linéaire. Pour diviser l’erreur standard par deux, il faut généralement environ quatre fois plus d’observations, car

\frac{1}{\sqrt{4n}} = \frac{1}{2\sqrt{n}}

Erreurs fréquentes sur l’erreur standard

Utiliser l’erreur standard et l’écart-type comme s’ils étaient interchangeables.
Dire qu’une petite erreur standard signifie que les données brutes sont peu dispersées. Cette conclusion ne suit pas, sauf si l’on sait aussi que l’écart-type est petit.
Oublier que la formule $SE(\bar{x}) \approx s/\sqrt{n}$ présentée ici concerne spécifiquement la moyenne d’échantillon.
Supposer qu’un échantillon plus grand corrige toujours le biais. Une valeur de $n$ plus grande réduit la variation aléatoire d’échantillonnage, mais ne corrige pas automatiquement un échantillon biaisé.

Quand utilise-t-on l’erreur standard ?

L’erreur standard est importante quand on veut évaluer la précision d’une estimation. Elle apparaît dans les intervalles de confiance, les tests d’hypothèse, les résultats de régression et les enquêtes.

Dans chaque cas, l’idée est la même : l’erreur standard aide à relier un échantillon à l’incertitude de l’estimation obtenue à partir de cet échantillon.

Essayez un problème similaire

Essayez votre propre version avec $s = 12$ et $n = 36$ . Calculez l’erreur standard de la moyenne, puis comparez-la au cas où $n = 144$ . C’est un moyen rapide de voir comment la taille de l’échantillon modifie la précision. Si vous voulez aller plus loin, étudiez ensuite un intervalle de confiance et voyez comment l’erreur standard influence sa largeur.

Besoin d'aide pour un problème ?

Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.

Ouvrir GPAI Solver →