En statistique, les types de données indiquent ce que représente une variable. Si les valeurs sont des étiquettes comme « rouge » ou « biologie », les données sont qualitatives. Si les valeurs sont des quantités numériques, les données sont quantitatives. Ensuite, pour les données quantitatives, on pose généralement une autre question : s’agit-il d’un comptage discret ou d’une mesure continue ?

C’est important, car le type de données influence les graphiques, les résumés et les modèles qui ont du sens. Une moyenne peut être utile pour des tailles, mais pas pour la couleur des yeux.

Données qualitatives vs quantitatives

Les données qualitatives correspondent à des catégories

Les données qualitatives décrivent des qualités, des groupes ou des étiquettes plutôt que des quantités numériques. Par exemple : la couleur d’une voiture, le groupe sanguin ou le pays.

Ce type de données est aussi souvent appelé données catégorielles.

Les données quantitatives correspondent à des quantités numériques

Les données quantitatives enregistrent une quantité numérique. Le nombre n’est pas seulement une étiquette ; il représente combien, en quelle quantité ou à quelle distance.

Par exemple : l’âge, la taille, la note à un test et le nombre d’animaux de compagnie.

Données discrètes vs continues

Les données discrètes proviennent d’un comptage

Les données discrètes sont des données quantitatives qui proviennent généralement d’un comptage. Les valeurs passent d’une valeur autorisée à une autre au lieu de remplir tout un intervalle.

Le nombre d’élèves dans une classe est discret, car on compte des élèves entiers. Dans un modèle de comptage ordinaire, des valeurs comme 24.524.5 élèves n’ont pas de sens.

Les données continues proviennent d’une mesure

Les données continues sont des données quantitatives qui proviennent généralement d’une mesure. En principe, la valeur peut être enregistrée avec une précision de plus en plus fine, selon l’instrument de mesure et le contexte.

La taille, le temps et la température sont des exemples classiques. La taille d’une personne peut s’écrire 170170 cm, 170.2170.2 cm ou 170.24170.24 cm selon la précision utilisée.

Exemple résolu : classer des données d’élèves

Supposons qu’une école enregistre ces quatre variables pour chaque élève :

  • classe
  • nombre de frères et sœurs
  • temps de trajet jusqu’à l’école
  • matière préférée

Voici comment les classer.

Classe est une variable qualitative, car c’est une étiquette de groupe.

Nombre de frères et sœurs est une variable quantitative et discrète, car c’est un comptage : 0,1,2,3,0, 1, 2, 3, etc.

Temps de trajet jusqu’à l’école est une variable quantitative et continue, car il est mesuré. On peut l’arrondir à la minute la plus proche, mais la variable sous-jacente peut varier plus finement que cela.

Matière préférée est une variable qualitative, car elle désigne une catégorie et non une quantité.

Cet exemple montre le cheminement principal. Demandez d’abord : « étiquette ou quantité ? » Si c’est une quantité, demandez : « comptage ou mesure ? »

Comment reconnaître le type de données

Utilisez cette règle pratique :

  1. Si calculer la moyenne des valeurs n’aurait aucun sens, les données sont probablement qualitatives.
  2. Si calculer la moyenne a du sens, les données sont probablement quantitatives.
  3. Si les valeurs quantitatives proviennent du comptage d’éléments distincts, elles sont généralement discrètes.
  4. Si elles proviennent d’une mesure sur une échelle, elles sont généralement continues.

C’est un raccourci pratique, pas une preuve formelle. Le contexte de la variable reste important.

Erreurs fréquentes sur les types de données en statistique

Prendre des codes numériques pour de vraies quantités

Si des réponses d’enquête sont codées par 11, 22 et 33, ces nombres peuvent tout de même représenter des catégories plutôt que de vraies quantités. La présence d’un nombre dans les données ne rend pas automatiquement la variable quantitative.

Supposer que toute valeur entière est discrète

Une mesure enregistrée peut apparaître comme un nombre entier simplement parce qu’elle a été arrondie. Par exemple, des poids notés 6868, 7272 et 7575 kilogrammes restent des données continues si le poids a été mesuré et non compté.

Confondre la variable avec sa façon d’être enregistrée

Un temps de trajet arrondi à la minute la plus proche est souvent stocké sous forme de nombres entiers, mais la variable elle-même reste continue. Le format d’enregistrement ne change pas toujours le type sous-jacent.

Où ces types de données sont utilisés en statistique

Cette classification compte chaque fois que vous choisissez un graphique, un résumé ou une méthode statistique.

Pour les données qualitatives, les diagrammes en barres et les tableaux de fréquences sont courants. Pour les données quantitatives, les histogrammes, les boîtes à moustaches, les moyennes, les médianes et les écarts-types peuvent être utiles.

La distinction entre discret et continu compte aussi lorsqu’on choisit un modèle de probabilité. Certains modèles sont conçus pour des comptages, tandis que d’autres sont conçus pour des mesures sur un continuum.

Essayez avec vos propres exemples

Prenez cinq variables de la vie courante, comme la pointure, le code postal, la température, le nombre d’e-mails ou la couleur des cheveux, puis classez chacune d’elles. Si un cas vous semble ambigu, indiquez la condition qui permet de trancher, par exemple si la valeur est une étiquette, un comptage ou une mesure.

Si vous voulez aller un peu plus loin, examinez un autre cas en vous demandant quel graphique ou quel résumé a du sens pour chaque variable, et lequel n’en a pas.

Besoin d'aide pour un problème ?

Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.

Ouvrir GPAI Solver →