Un diagramme en boîte à moustaches montre en un coup d’œil le centre, la dispersion et une éventuelle asymétrie d’un ensemble de données. Il est construit à partir du résumé à cinq nombres : minimum, premier quartile , médiane, troisième quartile et maximum. Si votre cours ou votre logiciel utilise la règle des , les moustaches peuvent s’arrêter aux valeurs extrêmes non aberrantes plutôt qu’au minimum et au maximum absolus.
La boîte va de à , donc elle contient les centraux des données. La ligne à l’intérieur de la boîte est la médiane. Les moustaches montrent jusqu’où les données s’étendent au-delà de cette moitié centrale.
Ce que montre un diagramme en boîte à moustaches
Un diagramme en boîte aide à répondre rapidement à trois questions :
- Où se situe le centre ? Regardez la médiane.
- Quelle est la dispersion de la moitié centrale ? Regardez la largeur de la boîte.
- Les deux extrémités sont-elles équilibrées ? Comparez les deux moustaches.
La largeur de la boîte est l’écart interquartile, ou . Un plus grand signifie que la moitié centrale des données est plus dispersée. Si une moustache est beaucoup plus longue que l’autre, les données peuvent être asymétriques dans cette direction.
Beaucoup de diagrammes en boîte utilisent aussi la règle des pour repérer des valeurs aberrantes possibles. Dans cette version, les moustaches s’arrêtent aux valeurs extrêmes non aberrantes. C’est pourquoi deux diagrammes en boîte corrects pour les mêmes données peuvent avoir un aspect légèrement différent s’ils utilisent des règles différentes pour les moustaches.
Exemple détaillé : des données au diagramme en boîte
Utilisez l’ensemble de données ordonné
Il y a valeurs, donc la médiane est la moyenne des deux valeurs centrales :
Comme il y a un nombre pair de données, on partage la liste en deux moitiés égales. La moitié inférieure est , donc
La moitié supérieure est , donc
On obtient alors le résumé à cinq nombres :
Calculez maintenant l’écart interquartile :
Si vous utilisez la règle courante des valeurs aberrantes , les bornes sont
et
Toutes les valeurs des données se situent entre et , donc il n’y a pas de valeur aberrante possible selon cette règle. Pour cet ensemble de données, la boîte irait de à , la ligne de médiane serait à et les moustaches atteindraient et .
Comment lire rapidement un diagramme en boîte
Commencez par la ligne de médiane. Elle indique où se situe le centre des données.
Comparez ensuite la largeur de la boîte et la longueur des moustaches. La boîte montre où se trouvent les centraux des valeurs, tandis que les moustaches montrent jusqu’où les extrémités s’étendent au-delà de cette zone.
Enfin, recherchez une asymétrie. Si la médiane n’est pas centrée dans la boîte, ou si une moustache est beaucoup plus longue que l’autre, la distribution n’est peut-être pas équilibrée autour du centre.
Erreurs fréquentes avec les diagrammes en boîte à moustaches
Une erreur fréquente consiste à lire les bords de la boîte comme le minimum et le maximum. Ils représentent généralement et , et non les extrémités de l’ensemble de données complet.
Une autre erreur consiste à supposer que tous les diagrammes en boîte utilisent la même règle pour les moustaches. Certaines moustaches vont jusqu’au minimum et au maximum. D’autres s’arrêtent aux valeurs extrêmes non aberrantes.
Il est aussi facile d’oublier que les quartiles dépendent de données ordonnées. Si les valeurs ne sont pas d’abord triées, les quartiles et la médiane seront faux.
Quand les diagrammes en boîte sont utiles
Les diagrammes en boîte à moustaches sont utiles lorsque vous voulez un résumé rapide d’une distribution plutôt qu’une liste complète de valeurs. Ils sont courants en cours de statistique, dans les résumés d’expériences, le contrôle qualité et les comparaisons entre groupes.
Ils sont particulièrement utiles lorsque les valeurs aberrantes ou l’asymétrie comptent, car la médiane et les quartiles sont généralement plus stables que la moyenne prise seule.
Essayez avec un ensemble de données similaire
Prenez un petit ensemble de données trié, écrivez son résumé à cinq nombres et esquissez la boîte avant de vous préoccuper des valeurs aberrantes. Si vous voulez vérifier vos quartiles et votre médiane sur un problème de statistique similaire, essayez votre propre version dans un solveur après avoir vous-même établi la liste ordonnée.
Besoin d'aide pour un problème ?
Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.
Ouvrir GPAI Solver →