La variance mesure à quel point des nombres sont dispersés autour de leur moyenne. Une faible variance signifie que les valeurs restent assez proches de la moyenne. Une grande variance signifie qu’elles sont plus étalées.

Pour calculer la variance, on détermine l’écart de chaque valeur à la moyenne, on élève ces écarts au carré, puis on en fait la moyenne. Le carré est important, car sinon les écarts positifs et négatifs s’annuleraient.

Formule de la variance : population vs échantillon

Utilisez la formule de la variance de population lorsque vos données comprennent toutes les valeurs du groupe que vous voulez décrire :

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

Utilisez la formule de la variance d’échantillon lorsque vos données ne sont qu’un échantillon et que vous voulez estimer la dispersion d’une population plus grande :

s2=1n1i=1n(xixˉ)2s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2

La seule différence est le dénominateur. Utilisez NN pour une population complète. Utilisez n1n-1 pour une estimation à partir d’un échantillon.

Ce que signifie la variance

La variance n’indique pas où se trouve le centre. Elle indique à quelle distance les données ont tendance à se situer de ce centre.

Si deux ensembles de données ont la même moyenne, celui qui a la plus grande variance contient en moyenne des valeurs plus éloignées de la moyenne. Comme les écarts sont élevés au carré, les écarts inhabituellement grands ont davantage d’influence.

Un détail important : la variance s’exprime en unités au carré. Si les données sont en mètres, la variance est en mètres carrés. C’est pourquoi l’écart-type est souvent plus facile à interpréter dans la vie courante.

Comment calculer la variance : exemple détaillé

Utilisez l’ensemble de données 2,4,4,4,5,5,7,92, 4, 4, 4, 5, 5, 7, 9.

Commencez par calculer la moyenne :

xˉ=2+4+4+4+5+5+7+98=408=5\bar{x} = \frac{2+4+4+4+5+5+7+9}{8} = \frac{40}{8} = 5

Soustrayez maintenant la moyenne de chaque valeur et élevez le résultat au carré :

  • (25)2=9(2-5)^2 = 9
  • (45)2=1(4-5)^2 = 1
  • (45)2=1(4-5)^2 = 1
  • (45)2=1(4-5)^2 = 1
  • (55)2=0(5-5)^2 = 0
  • (55)2=0(5-5)^2 = 0
  • (75)2=4(7-5)^2 = 4
  • (95)2=16(9-5)^2 = 16

Additionnez ces écarts au carré :

9+1+1+1+0+0+4+16=329+1+1+1+0+0+4+16 = 32

Si ces huit valeurs constituent toute la population, la variance de population est :

σ2=328=4\sigma^2 = \frac{32}{8} = 4

Si ces huit mêmes valeurs sont considérées comme un échantillon d’une population plus grande, la variance d’échantillon est :

s2=3274.57s^2 = \frac{32}{7} \approx 4.57

Cet exemple montre clairement l’idée principale : les écarts au carré sont les mêmes, mais la réponse finale change selon que l’on divise par NN ou par n1n-1.

Erreurs fréquentes sur la variance

  • Oublier d’élever les écarts au carré. Si vous faites la moyenne des écarts bruts, les valeurs positives et négatives s’annulent, et vous ne mesurez plus correctement la dispersion.
  • Confondre variance de population et variance d’échantillon. Divisez par NN pour une population complète et par n1n-1 pour un échantillon servant à estimer une population plus grande.
  • Oublier que la variance utilise des unités au carré. La variance est utile, mais l’écart-type est souvent plus facile à lire, car il revient aux unités d’origine.
  • Supposer qu’une grande variance est toujours mauvaise. Une variance plus grande signifie seulement une dispersion plus forte. Son importance dépend du contexte.

Quand utilise-t-on la variance ?

La variance est utilisée chaque fois que vous devez décrire ou comparer la dispersion de manière cohérente.

  • En statistique, elle aide à résumer à quel point un ensemble de données est dispersé.
  • En contrôle qualité, elle peut aider à suivre si un processus reste stable dans le temps.
  • En finance, la variance sert à décrire l’ampleur des fluctuations des rendements, même si ce n’est qu’une façon parmi d’autres de penser le risque.
  • En apprentissage automatique et en analyse de données, elle aide à décrire comment les variables ou les erreurs varient d’une observation à l’autre.

Essayez un problème similaire

Essayez votre propre version avec deux petits ensembles de données qui ont la même moyenne mais une dispersion différente. Calculez la variance des deux et vérifiez si l’ensemble le plus étalé obtient la plus grande valeur. Cette seule comparaison suffit souvent à bien faire comprendre l’idée.

Besoin d'aide pour un problème ?

Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.

Ouvrir GPAI Solver →