Les mesures de dispersion indiquent à quel point un ensemble de données est étalé. Les trois mesures de base sont l’étendue, la variance et l’écart-type. L’étendue n’utilise que la plus petite et la plus grande valeur, la variance mesure la distance quadratique moyenne à la moyenne, et l’écart-type est la racine carrée de la variance, ce qui ramène la dispersion aux unités d’origine.

Si vous voulez retenir l’essentiel rapidement, utilisez l’étendue pour un aperçu rapide, la variance pour un travail statistique formel, et l’écart-type lorsque vous voulez une mesure de dispersion plus facile à interpréter.

Étendue, variance et écart-type en un coup d’œil

L’étendue est la distance entre la valeur minimale et la valeur maximale :

range=maximumminimum\text{range} = \text{maximum} - \text{minimum}

Elle est rapide à calculer, mais elle n’utilise que deux valeurs. Une seule valeur extrême peut la modifier fortement.

La variance mesure à quelle distance les valeurs se situent en général de la moyenne, après avoir élevé ces distances au carré.

Pour une population complète,

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

Pour un échantillon utilisé pour estimer une population plus grande,

s2=1n1i=1n(xixˉ)2s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2

Utilisez NN seulement lorsque vos données représentent toute la population qui vous intéresse. Utilisez n1n-1 lorsque vos données sont un échantillon tiré d’un groupe plus large.

L’écart-type est la racine carrée de la variance :

σ=σ2\sigma = \sqrt{\sigma^2}

ou, pour un échantillon,

s=s2s = \sqrt{s^2}

Comme il est exprimé dans les unités d’origine, l’écart-type est généralement plus facile à lire que la variance.

Exemple détaillé : même étendue, dispersion différente

Comparez ces deux ensembles de données :

  • Ensemble A : 2,5,5,5,82, 5, 5, 5, 8
  • Ensemble B : 2,2,5,8,82, 2, 5, 8, 8

Les deux ont le même minimum, le même maximum et la même moyenne.

Pour chaque ensemble,

range=82=6\text{range} = 8 - 2 = 6

et

mean=255=5\text{mean} = \frac{25}{5} = 5

Donc, l’étendue seule dit qu’ils ont la même largeur. Mais les valeurs sont réparties différemment autour de la moyenne.

Ensemble A

Les écarts à la moyenne sont

3, 0, 0, 0, 3-3,\ 0,\ 0,\ 0,\ 3

En les élevant au carré, on obtient

9, 0, 0, 0, 99,\ 0,\ 0,\ 0,\ 9

La somme des écarts au carré est 1818. Si l’on considère les données comme une population,

σ2=185=3.6\sigma^2 = \frac{18}{5} = 3.6

et

σ=3.61.90\sigma = \sqrt{3.6} \approx 1.90

Ensemble B

Les écarts à la moyenne sont

3, 3, 0, 3, 3-3,\ -3,\ 0,\ 3,\ 3

En les élevant au carré, on obtient

9, 9, 0, 9, 99,\ 9,\ 0,\ 9,\ 9

La somme des écarts au carré est 3636, donc

σ2=365=7.2\sigma^2 = \frac{36}{5} = 7.2

et

σ=7.22.68\sigma = \sqrt{7.2} \approx 2.68

Les deux ensembles ont la même étendue, mais l’ensemble B a une variance et un écart-type plus grands. Voilà l’idée essentielle : l’étendue ne voit que les extrémités, tandis que la variance et l’écart-type utilisent l’ensemble des données.

Erreurs fréquentes avec les mesures de dispersion

Une erreur fréquente consiste à supposer qu’une même étendue signifie une même dispersion. L’exemple ci-dessus montre pourquoi c’est faux.

Une autre erreur consiste à traiter la variance comme si elle était exprimée dans les unités d’origine. Ce n’est pas le cas. Si les données sont en mètres, la variance est en mètres carrés.

Une troisième erreur consiste à confondre les formules pour la population et pour l’échantillon. Le bon dénominateur dépend de la situation : utilisez NN pour une population complète et n1n-1 pour un échantillon.

Il est aussi utile de se rappeler que la variance et l’écart-type sont sensibles aux valeurs aberrantes, car les grands écarts sont élevés au carré avant d’être moyennés.

Quand chaque mesure est utile

Utilisez l’étendue lorsque vous voulez un premier aperçu rapide de l’ampleur des données.

Utilisez la variance lorsque vous avez besoin de la mesure de dispersion dans d’autres méthodes statistiques. De nombreuses formules en probabilités et en statistique reposent sur la variance, même lorsque les résultats présentent ensuite l’écart-type.

Utilisez l’écart-type lorsque vous voulez une description pratique de la dispersion dans les mêmes unités que les données. Dans de nombreux résumés scolaires et concrets, c’est le choix le plus lisible.

Essayez un problème similaire

Créez deux petits ensembles de données ayant la même moyenne et la même étendue, puis comparez leur variance et leur écart-type. Si vous voulez aller plus loin, essayez votre propre version dans un solveur après l’avoir résolue à la main.

Besoin d'aide pour un problème ?

Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.

Ouvrir GPAI Solver →