Un diagramma di dispersione mostra la relazione tra due variabili numeriche. Ogni punto rappresenta una coppia di valori, quindi puoi vedere rapidamente se i dati crescono, diminuiscono, si disperdono, formano gruppi o contengono punti insoliti.

Questo rende il diagramma di dispersione il modo più rapido per rispondere alla domanda che molti studenti si pongono davvero: "Che cosa sta succedendo in questi dati?" Prima di calcolare la correlazione o tracciare una retta di adattamento, il grafico ti dice se questi riassunti hanno davvero senso.

Come leggere un diagramma di dispersione

L'asse orizzontale mostra una variabile e l'asse verticale mostra l'altra. Se uno studente ha studiato per 44 ore e ha ottenuto 7878, il punto è (4,78)(4,78).

Una volta riportati i punti sul grafico, osserva il modello generale:

  • Correlazione positiva: i punti tendono a salire da sinistra a destra.
  • Correlazione negativa: i punti tendono a scendere da sinistra a destra.
  • Correlazione poca o nulla: i punti non mostrano una forte tendenza lineare.

Controlla anche la presenza di gruppi di punti, spazi vuoti e valori anomali. I dati reali quasi mai cadono esattamente su una sola retta, quindi l'obiettivo è vedere la tendenza, non un allineamento perfetto.

Che cosa significa la correlazione in un diagramma di dispersione

La correlazione descrive la direzione e l'intensità di una relazione lineare. "Lineare" è la condizione chiave: la correlazione riassume quanto bene i punti seguono una tendenza in linea retta.

Se i punti si raggruppano attorno a una retta crescente, la correlazione è positiva. Se si raggruppano attorno a una retta decrescente, la correlazione è negativa. Se i punti appaiono dispersi senza una chiara direzione rettilinea, la correlazione lineare è debole o vicina a zero.

Un andamento curvo può comunque mostrare una relazione reale. Semplicemente, potrebbe non avere una forte correlazione lineare.

Quando una retta di adattamento è utile

Una retta di adattamento è una linea retta tracciata per rappresentare l'andamento generale dei punti. Non deve passare per ogni punto. Il suo compito è restare complessivamente vicina alla nuvola di punti.

Usa una retta di adattamento solo quando il diagramma di dispersione è approssimativamente lineare. In quel caso, la retta aiuta in due modi:

  • riassumere la tendenza
  • fare previsioni approssimative all'interno dell'intervallo osservato

Se il modello è curvo, diviso in gruppi o dominato da valori anomali, una retta di adattamento può nascondere più di quanto spieghi.

Esempio di diagramma di dispersione: ore di studio e punteggi al quiz

Supponiamo che un insegnante registri il tempo di studio e il punteggio al quiz di cinque studenti:

(1,55), (2,61), (3,68), (4,74), (5,81)(1,55),\ (2,61),\ (3,68),\ (4,74),\ (5,81)

Questi punti salgono da sinistra a destra e restano abbastanza vicini a una linea retta. Questo significa che la relazione è positiva e approssimativamente lineare.

Quindi sia la correlazione sia una retta di adattamento sono riassunti ragionevoli in questo caso. Ti aspetteresti che la retta di adattamento abbia una pendenza positiva, perché tempi di studio maggiori tendono ad accompagnarsi a punteggi al quiz più alti.

Ora aggiungi un punto in più in (5,40)(5,40). La tendenza può essere ancora positiva, ma questo punto è un valore anomalo e potrebbe trascinare verso il basso la retta di adattamento. Ecco perché il grafico deve venire prima del riassunto: l'immagine ti dice se il riassunto è affidabile.

Errori comuni nei diagrammi di dispersione

Confondere correlazione e causalità

Se due variabili si muovono insieme, questo non significa automaticamente che una causi l'altra. Un terzo fattore può influenzarle entrambe, oppure il modello può essere più complicato di quanto sembri a prima vista.

Forzare una retta su un andamento curvo

Alcuni dati seguono una curva invece di una linea retta. In quel caso, una retta di adattamento lineare può fornire un riassunto fuorviante.

Ignorare i valori anomali

Un solo punto insolito può cambiare molto la tendenza apparente. I valori anomali non significano sempre che i dati siano sbagliati, ma non dovrebbero mai essere ignorati senza controllare il contesto.

Dimenticare che cosa rappresenta un punto

Un diagramma di dispersione funziona solo per dati appaiati. Ogni punto deve provenire da un'osservazione che abbia sia un valore di xx sia un valore di yy.

Quando si usano i diagrammi di dispersione

I diagrammi di dispersione si usano in statistica, nelle scienze, nel business e nella ricerca sociale ogni volta che vuoi confrontare due variabili numeriche. Esempi comuni includono altezza e peso, spesa pubblicitaria e vendite, oppure tempo di studio e punteggio del test.

Sono particolarmente utili all'inizio di un'analisi perché possono rivelare modelli che una singola formula potrebbe nascondere, come gruppi di punti, spazi vuoti o valori anomali.

Prova un esercizio simile

Prendi un piccolo insieme di dati appaiati e disegna i punti prima di calcolare la correlazione. Poniti tre domande: il modello sale o scende, appare approssimativamente lineare e ci sono punti insolitamente lontani dagli altri?

Se il modello appare approssimativamente lineare, esplora gli stessi dati con un coefficiente di correlazione o una semplice retta di adattamento. Questo è il passaggio naturale dall'immagine al riassunto.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →