La fréquence cumulée est le total progressif dans un tableau de fréquences. Elle indique combien d’observations sont inférieures ou égales à une valeur ou à une borne de classe, ce qui la rend utile pour trouver la médiane, les quartiles et les percentiles.
Une ogive est le graphique de ce total progressif. Quand vous savez lire ensemble le tableau et le graphique, les questions sur les données groupées deviennent beaucoup plus simples.
Définition de la fréquence cumulée
Si les fréquences des classes sont , alors la fréquence cumulée jusqu’à la classe est
Chaque ligne ajoute une classe de plus au total. Si la fréquence cumulée vaut à la fin d’une classe, alors observations se trouvent dans cette classe ou dans une classe inférieure.
Pour des données non groupées, la fréquence cumulée est simplement un comptage progressif. Pour des données groupées, c’est un comptage progressif par intervalle de classe.
Comment une ogive aide à lire les percentiles
Une ogive représente la fréquence cumulée en fonction des bornes de classe. Pour des données continues groupées, on place généralement :
- la borne supérieure de classe sur l’axe horizontal
- la fréquence cumulée sur l’axe vertical
On relie ensuite les points par une courbe lisse ou une ligne brisée. La courbe monte, car la fréquence cumulée ne diminue jamais.
L’usage principal d’une ogive est de lire des positions dans la série ordonnée. Si la fréquence totale est , alors :
- la médiane se situe vers la e valeur
- le premier quartile se situe vers la e valeur
- le troisième quartile se situe vers la e valeur
- le e percentile se situe vers la e valeur
Sur le graphique, on part de cette position sur l’axe vertical, on va horizontalement jusqu’à l’ogive, puis on redescend vers l’axe horizontal pour estimer la valeur.
Exemple résolu : médiane et 75e percentile
Supposons que les notes d’un test pour élèves soient groupées ainsi :
| Note | Fréquence | Fréquence cumulée |
|---|---|---|
| 0-10 | ||
| 10-20 | ||
| 20-30 | ||
| 30-40 | ||
| 40-50 | ||
| 50-60 |
La fréquence totale est .
Trouver la médiane à partir du tableau
La médiane est la e valeur.
Regardons les fréquences cumulées :
- jusqu’à 20-30, le total est
- jusqu’à 30-40, le total est
Donc la e valeur se trouve dans la classe -.
Si vous voulez une estimation pour des données groupées, utilisez l’interpolation seulement s’il est raisonnable de considérer que les valeurs sont réparties assez uniformément dans cette classe. Alors
Ici :
- est la borne inférieure de la classe
- est la fréquence cumulée avant la classe
- est la fréquence de la classe
- est l’amplitude de la classe
Donc
Cette estimation n’est pas exacte. Elle dépend de l’hypothèse selon laquelle les valeurs à l’intérieur de la classe - sont réparties de manière assez régulière.
Estimer le 75e percentile
Le e percentile est la e valeur.
D’après les fréquences cumulées :
- jusqu’à 30-40, le total est
- jusqu’à 40-50, le total est
Donc la e valeur se trouve dans la classe -.
En utilisant la même idée d’interpolation,
Sur une ogive, vous placeriez sur l’axe des fréquences cumulées, vous iriez horizontalement jusqu’à la courbe, puis vous liriez vers le bas environ sur l’axe des notes.
Erreurs fréquentes avec la fréquence cumulée
Confondre fréquence et fréquence cumulée
La fréquence indique combien d’observations se trouvent dans une seule classe. La fréquence cumulée indique combien d’observations se trouvent dans cette classe et dans toutes les classes précédentes réunies.
Utiliser la mauvaise position
Pour la médiane ou un percentile, la position se calcule à partir de la fréquence totale . Si vous utilisez un mauvais total, toutes les étapes suivantes seront fausses.
Considérer les estimations groupées comme exactes
Une ogive ou une interpolation donne une estimation à l’intérieur d’une classe, pas une valeur exacte des données d’origine. Cette estimation dépend de la façon dont les données sont réparties dans l’intervalle.
Placer les mauvaises valeurs sur l’axe horizontal
Pour des données groupées, les ogives se tracent généralement à partir des bornes de classe, en particulier des bornes supérieures. Tracer avec les milieux de classe change le sens du graphique.
Quand utilise-t-on la fréquence cumulée ?
La fréquence cumulée est utilisée chaque fois qu’on a besoin de la position ordonnée dans un ensemble de données plutôt que de simples effectifs par classe. Cela inclut les résumés de notes d’examen, les distributions de revenus, les données de contrôle qualité et toute situation où les percentiles ou les médianes comptent davantage que les effectifs de chaque intervalle.
Elle est particulièrement utile lorsque les données brutes sont nombreuses et qu’un tableau groupé est plus facile à lire qu’une longue liste d’observations.
Essayez un exercice similaire sur la fréquence cumulée
Prenez n’importe quel petit tableau groupé et ajoutez une colonne de fréquences cumulées avant de tracer une ogive. Lisez ensuite la médiane et un percentile sur le graphique, puis comparez-les avec l’estimation obtenue à partir du tableau.
Si vous voulez une vérification supplémentaire, essayez votre propre version avec et demandez-vous où se situeraient les e, e et e valeurs. C’est une manière simple de bien ancrer l’idée.
Besoin d'aide pour un problème ?
Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.
Ouvrir GPAI Solver →