La fréquence cumulée est le total progressif dans un tableau de fréquences. Elle indique combien d’observations sont inférieures ou égales à une valeur ou à une borne de classe, ce qui la rend utile pour trouver la médiane, les quartiles et les percentiles.

Une ogive est le graphique de ce total progressif. Quand vous savez lire ensemble le tableau et le graphique, les questions sur les données groupées deviennent beaucoup plus simples.

Définition de la fréquence cumulée

Si les fréquences des classes sont f1,f2,,fkf_1, f_2, \dots, f_k, alors la fréquence cumulée jusqu’à la classe kk est

Fk=f1+f2++fkF_k = f_1 + f_2 + \cdots + f_k

Chaque ligne ajoute une classe de plus au total. Si la fréquence cumulée vaut 2828 à la fin d’une classe, alors 2828 observations se trouvent dans cette classe ou dans une classe inférieure.

Pour des données non groupées, la fréquence cumulée est simplement un comptage progressif. Pour des données groupées, c’est un comptage progressif par intervalle de classe.

Comment une ogive aide à lire les percentiles

Une ogive représente la fréquence cumulée en fonction des bornes de classe. Pour des données continues groupées, on place généralement :

  • la borne supérieure de classe sur l’axe horizontal
  • la fréquence cumulée sur l’axe vertical

On relie ensuite les points par une courbe lisse ou une ligne brisée. La courbe monte, car la fréquence cumulée ne diminue jamais.

L’usage principal d’une ogive est de lire des positions dans la série ordonnée. Si la fréquence totale est NN, alors :

  • la médiane se situe vers la N/2N/2e valeur
  • le premier quartile se situe vers la N/4N/4e valeur
  • le troisième quartile se situe vers la 3N/43N/4e valeur
  • le ppe percentile se situe vers la (p/100)N(p/100)Ne valeur

Sur le graphique, on part de cette position sur l’axe vertical, on va horizontalement jusqu’à l’ogive, puis on redescend vers l’axe horizontal pour estimer la valeur.

Exemple résolu : médiane et 75e percentile

Supposons que les notes d’un test pour 4040 élèves soient groupées ainsi :

Note Fréquence Fréquence cumulée
0-10 22 22
10-20 55 77
20-30 99 1616
30-40 1212 2828
40-50 88 3636
50-60 44 4040

La fréquence totale est N=40N = 40.

Trouver la médiane à partir du tableau

La médiane est la N/2=20N/2 = 20e valeur.

Regardons les fréquences cumulées :

  • jusqu’à 20-30, le total est 1616
  • jusqu’à 30-40, le total est 2828

Donc la 2020e valeur se trouve dans la classe 3030-4040.

Si vous voulez une estimation pour des données groupées, utilisez l’interpolation seulement s’il est raisonnable de considérer que les valeurs sont réparties assez uniformément dans cette classe. Alors

medianL+N/2Fbeforefw\text{median} \approx L + \frac{N/2 - F_{\text{before}}}{f} \cdot w

Ici :

  • L=30L = 30 est la borne inférieure de la classe
  • Fbefore=16F_{\text{before}} = 16 est la fréquence cumulée avant la classe
  • f=12f = 12 est la fréquence de la classe
  • w=10w = 10 est l’amplitude de la classe

Donc

median30+20161210=30+401233.3\text{median} \approx 30 + \frac{20 - 16}{12} \cdot 10 = 30 + \frac{40}{12} \approx 33.3

Cette estimation n’est pas exacte. Elle dépend de l’hypothèse selon laquelle les valeurs à l’intérieur de la classe 3030-4040 sont réparties de manière assez régulière.

Estimer le 75e percentile

Le 7575e percentile est la (75/100)40=30(75/100) \cdot 40 = 30e valeur.

D’après les fréquences cumulées :

  • jusqu’à 30-40, le total est 2828
  • jusqu’à 40-50, le total est 3636

Donc la 3030e valeur se trouve dans la classe 4040-5050.

En utilisant la même idée d’interpolation,

P7540+3028810=42.5P_{75} \approx 40 + \frac{30 - 28}{8} \cdot 10 = 42.5

Sur une ogive, vous placeriez 3030 sur l’axe des fréquences cumulées, vous iriez horizontalement jusqu’à la courbe, puis vous liriez vers le bas environ 42.542.5 sur l’axe des notes.

Erreurs fréquentes avec la fréquence cumulée

Confondre fréquence et fréquence cumulée

La fréquence indique combien d’observations se trouvent dans une seule classe. La fréquence cumulée indique combien d’observations se trouvent dans cette classe et dans toutes les classes précédentes réunies.

Utiliser la mauvaise position

Pour la médiane ou un percentile, la position se calcule à partir de la fréquence totale NN. Si vous utilisez un mauvais total, toutes les étapes suivantes seront fausses.

Considérer les estimations groupées comme exactes

Une ogive ou une interpolation donne une estimation à l’intérieur d’une classe, pas une valeur exacte des données d’origine. Cette estimation dépend de la façon dont les données sont réparties dans l’intervalle.

Placer les mauvaises valeurs sur l’axe horizontal

Pour des données groupées, les ogives se tracent généralement à partir des bornes de classe, en particulier des bornes supérieures. Tracer avec les milieux de classe change le sens du graphique.

Quand utilise-t-on la fréquence cumulée ?

La fréquence cumulée est utilisée chaque fois qu’on a besoin de la position ordonnée dans un ensemble de données plutôt que de simples effectifs par classe. Cela inclut les résumés de notes d’examen, les distributions de revenus, les données de contrôle qualité et toute situation où les percentiles ou les médianes comptent davantage que les effectifs de chaque intervalle.

Elle est particulièrement utile lorsque les données brutes sont nombreuses et qu’un tableau groupé est plus facile à lire qu’une longue liste d’observations.

Essayez un exercice similaire sur la fréquence cumulée

Prenez n’importe quel petit tableau groupé et ajoutez une colonne de fréquences cumulées avant de tracer une ogive. Lisez ensuite la médiane et un percentile sur le graphique, puis comparez-les avec l’estimation obtenue à partir du tableau.

Si vous voulez une vérification supplémentaire, essayez votre propre version avec N=50N = 50 et demandez-vous où se situeraient les 2020e, 2525e et 4545e valeurs. C’est une manière simple de bien ancrer l’idée.

Besoin d'aide pour un problème ?

Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.

Ouvrir GPAI Solver →