Un diagramme en boîte à moustaches montre en un coup d’œil le centre, la dispersion et une éventuelle asymétrie d’un ensemble de données. Il est construit à partir du résumé à cinq nombres : minimum, premier quartile Q1Q_1, médiane, troisième quartile Q3Q_3 et maximum. Si votre cours ou votre logiciel utilise la règle des 1.5×IQR1.5 \times IQR, les moustaches peuvent s’arrêter aux valeurs extrêmes non aberrantes plutôt qu’au minimum et au maximum absolus.

La boîte va de Q1Q_1 à Q3Q_3, donc elle contient les 50%50\% centraux des données. La ligne à l’intérieur de la boîte est la médiane. Les moustaches montrent jusqu’où les données s’étendent au-delà de cette moitié centrale.

Ce que montre un diagramme en boîte à moustaches

Un diagramme en boîte aide à répondre rapidement à trois questions :

  • Où se situe le centre ? Regardez la médiane.
  • Quelle est la dispersion de la moitié centrale ? Regardez la largeur de la boîte.
  • Les deux extrémités sont-elles équilibrées ? Comparez les deux moustaches.

La largeur de la boîte est l’écart interquartile, ou IQR=Q3Q1IQR = Q_3 - Q_1. Un IQRIQR plus grand signifie que la moitié centrale des données est plus dispersée. Si une moustache est beaucoup plus longue que l’autre, les données peuvent être asymétriques dans cette direction.

Beaucoup de diagrammes en boîte utilisent aussi la règle des 1.5×IQR1.5 \times IQR pour repérer des valeurs aberrantes possibles. Dans cette version, les moustaches s’arrêtent aux valeurs extrêmes non aberrantes. C’est pourquoi deux diagrammes en boîte corrects pour les mêmes données peuvent avoir un aspect légèrement différent s’ils utilisent des règles différentes pour les moustaches.

Exemple détaillé : des données au diagramme en boîte

Utilisez l’ensemble de données ordonné

3, 5, 6, 7, 8, 9, 12, 153,\ 5,\ 6,\ 7,\ 8,\ 9,\ 12,\ 15

Il y a 88 valeurs, donc la médiane est la moyenne des deux valeurs centrales :

median=7+82=7.5\text{median} = \frac{7 + 8}{2} = 7.5

Comme il y a un nombre pair de données, on partage la liste en deux moitiés égales. La moitié inférieure est 3,5,6,73, 5, 6, 7, donc

Q1=5+62=5.5Q_1 = \frac{5 + 6}{2} = 5.5

La moitié supérieure est 8,9,12,158, 9, 12, 15, donc

Q3=9+122=10.5Q_3 = \frac{9 + 12}{2} = 10.5

On obtient alors le résumé à cinq nombres :

min=3,Q1=5.5,median=7.5,Q3=10.5,max=15\text{min} = 3,\quad Q_1 = 5.5,\quad \text{median} = 7.5,\quad Q_3 = 10.5,\quad \text{max} = 15

Calculez maintenant l’écart interquartile :

IQR=Q3Q1=10.55.5=5IQR = Q_3 - Q_1 = 10.5 - 5.5 = 5

Si vous utilisez la règle courante des valeurs aberrantes 1.5×IQR1.5 \times IQR, les bornes sont

Q11.5(IQR)=5.57.5=2Q_1 - 1.5(IQR) = 5.5 - 7.5 = -2

et

Q3+1.5(IQR)=10.5+7.5=18Q_3 + 1.5(IQR) = 10.5 + 7.5 = 18

Toutes les valeurs des données se situent entre 2-2 et 1818, donc il n’y a pas de valeur aberrante possible selon cette règle. Pour cet ensemble de données, la boîte irait de 5.55.5 à 10.510.5, la ligne de médiane serait à 7.57.5 et les moustaches atteindraient 33 et 1515.

Comment lire rapidement un diagramme en boîte

Commencez par la ligne de médiane. Elle indique où se situe le centre des données.

Comparez ensuite la largeur de la boîte et la longueur des moustaches. La boîte montre où se trouvent les 50%50\% centraux des valeurs, tandis que les moustaches montrent jusqu’où les extrémités s’étendent au-delà de cette zone.

Enfin, recherchez une asymétrie. Si la médiane n’est pas centrée dans la boîte, ou si une moustache est beaucoup plus longue que l’autre, la distribution n’est peut-être pas équilibrée autour du centre.

Erreurs fréquentes avec les diagrammes en boîte à moustaches

Une erreur fréquente consiste à lire les bords de la boîte comme le minimum et le maximum. Ils représentent généralement Q1Q_1 et Q3Q_3, et non les extrémités de l’ensemble de données complet.

Une autre erreur consiste à supposer que tous les diagrammes en boîte utilisent la même règle pour les moustaches. Certaines moustaches vont jusqu’au minimum et au maximum. D’autres s’arrêtent aux valeurs extrêmes non aberrantes.

Il est aussi facile d’oublier que les quartiles dépendent de données ordonnées. Si les valeurs ne sont pas d’abord triées, les quartiles et la médiane seront faux.

Quand les diagrammes en boîte sont utiles

Les diagrammes en boîte à moustaches sont utiles lorsque vous voulez un résumé rapide d’une distribution plutôt qu’une liste complète de valeurs. Ils sont courants en cours de statistique, dans les résumés d’expériences, le contrôle qualité et les comparaisons entre groupes.

Ils sont particulièrement utiles lorsque les valeurs aberrantes ou l’asymétrie comptent, car la médiane et les quartiles sont généralement plus stables que la moyenne prise seule.

Essayez avec un ensemble de données similaire

Prenez un petit ensemble de données trié, écrivez son résumé à cinq nombres et esquissez la boîte avant de vous préoccuper des valeurs aberrantes. Si vous voulez vérifier vos quartiles et votre médiane sur un problème de statistique similaire, essayez votre propre version dans un solveur après avoir vous-même établi la liste ordonnée.

Besoin d'aide pour un problème ?

Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.

Ouvrir GPAI Solver →