Un nuage de points montre la relation entre deux variables numériques. Chaque point représente une paire de valeurs, ce qui permet de voir rapidement si les données montent, descendent, se dispersent, se regroupent ou contiennent des points inhabituels.

Cela fait du nuage de points le moyen le plus rapide de répondre à la question que la plupart des élèves se posent vraiment : « Que se passe-t-il dans ces données ? » Avant de calculer une corrélation ou de tracer une droite d’ajustement, le graphique vous indique si ces résumés ont seulement du sens.

Comment lire un nuage de points

L’axe horizontal représente une variable et l’axe vertical représente l’autre. Si un élève a étudié pendant 44 heures et a obtenu 7878, le point est (4,78)(4,78).

Une fois les points placés sur le graphique, observez la tendance générale :

  • Corrélation positive : les points ont tendance à monter de gauche à droite.
  • Corrélation négative : les points ont tendance à descendre de gauche à droite.
  • Corrélation faible ou inexistante : les points ne montrent pas de forte tendance linéaire.

Vérifiez aussi s’il y a des regroupements, des écarts et des valeurs aberrantes. Les données réelles tombent presque jamais exactement sur une seule droite, donc l’objectif est de voir la tendance, pas un alignement parfait.

Ce que signifie la corrélation sur un nuage de points

La corrélation décrit la direction et l’intensité d’une relation linéaire. « Linéaire » est la condition essentielle : la corrélation résume à quel point les points suivent une tendance en ligne droite.

Si les points se regroupent autour d’une droite montante, la corrélation est positive. S’ils se regroupent autour d’une droite descendante, la corrélation est négative. Si les points paraissent dispersés sans direction rectiligne claire, la corrélation linéaire est faible ou proche de zéro.

Une forme courbe peut tout de même montrer une vraie relation. Elle peut simplement ne pas avoir une forte corrélation linéaire.

Quand une droite d’ajustement est utile

Une droite d’ajustement est une droite tracée pour représenter la tendance générale des points. Elle n’a pas besoin de passer par tous les points. Son rôle est de rester globalement proche du nuage de points.

Utilisez une droite d’ajustement seulement lorsque le nuage de points est approximativement linéaire. Dans ce cas, la droite aide à deux choses :

  • résumer la tendance
  • faire des prédictions approximatives à l’intérieur de l’intervalle observé

Si la forme est courbe, divisée en groupes, ou dominée par des valeurs aberrantes, une droite d’ajustement peut masquer plus de choses qu’elle n’en explique.

Exemple de nuage de points : temps de révision et notes à un quiz

Supposons qu’un enseignant relève le temps de révision et la note à un quiz pour cinq élèves :

(1,55), (2,61), (3,68), (4,74), (5,81)(1,55),\ (2,61),\ (3,68),\ (4,74),\ (5,81)

Ces points montent de gauche à droite et restent assez proches d’une droite. Cela signifie que la relation est positive et approximativement linéaire.

Ici, la corrélation et une droite d’ajustement sont donc toutes deux des résumés raisonnables. On s’attendrait à ce que la droite d’ajustement ait une pente positive, car des temps de révision plus longs vont généralement avec de meilleures notes au quiz.

Ajoutez maintenant un point supplémentaire en (5,40)(5,40). La tendance peut rester positive, mais ce point est une valeur aberrante, et il peut tirer la droite d’ajustement vers le bas. C’est pourquoi le graphique doit venir avant le résumé : l’image vous dit si le résumé est fiable.

Erreurs fréquentes avec les nuages de points

Confondre corrélation et causalité

Si deux variables évoluent ensemble, cela ne signifie pas automatiquement que l’une cause l’autre. Un troisième facteur peut agir sur les deux, ou la situation peut être plus complexe qu’elle n’en a l’air au premier abord.

Forcer une droite sur une forme courbe

Certaines données suivent une courbe plutôt qu’une droite. Dans ce cas, une droite d’ajustement linéaire peut donner un résumé trompeur.

Ignorer les valeurs aberrantes

Un seul point inhabituel peut beaucoup changer la tendance apparente. Les valeurs aberrantes ne signifient pas toujours que les données sont fausses, mais elles ne doivent jamais être ignorées sans vérifier le contexte.

Oublier ce que représente un point

Un nuage de points ne fonctionne que pour des données appariées. Chaque point doit provenir d’une observation qui possède à la fois une valeur de xx et une valeur de yy.

Quand utilise-t-on les nuages de points ?

Les nuages de points sont utilisés en statistique, en sciences, en économie et en sciences sociales chaque fois que l’on veut comparer deux variables numériques. Parmi les exemples courants, on trouve la taille et le poids, les dépenses publicitaires et les ventes, ou le temps de révision et la note à un test.

Ils sont particulièrement utiles au début d’une analyse, car ils peuvent révéler des motifs qu’une formule unique peut cacher, comme des regroupements, des écarts ou des valeurs aberrantes.

Essayez un problème similaire

Prenez un petit ensemble de données appariées et esquissez les points avant de calculer la corrélation. Posez-vous trois questions : la tendance monte-t-elle ou descend-elle, semble-t-elle approximativement linéaire, et certains points sont-ils inhabituellement éloignés des autres ?

Si la forme semble approximativement linéaire, explorez les mêmes données avec un coefficient de corrélation ou une droite d’ajustement simple. C’est l’étape naturelle qui mène de l’image au résumé.

Besoin d'aide pour un problème ?

Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.

Ouvrir GPAI Solver →