Ένα διάγραμμα διασποράς δείχνει τη σχέση ανάμεσα σε δύο αριθμητικές μεταβλητές. Κάθε σημείο είναι ένα ζεύγος τιμών, οπότε μπορείς γρήγορα να δεις αν τα δεδομένα ανεβαίνουν, κατεβαίνουν, απλώνονται, σχηματίζουν συστάδες ή περιέχουν ασυνήθιστα σημεία.
Αυτό κάνει το διάγραμμα διασποράς τον πιο γρήγορο τρόπο να απαντήσεις στην ερώτηση που έχουν πραγματικά οι περισσότεροι μαθητές: «Τι συμβαίνει σε αυτά τα δεδομένα;». Πριν υπολογίσεις συσχέτιση ή σχεδιάσεις μια ευθεία καλύτερης προσαρμογής, το διάγραμμα σου δείχνει αν αυτές οι συνόψεις έχουν καν νόημα.
Πώς να διαβάζεις ένα διάγραμμα διασποράς
Ο οριζόντιος άξονας δείχνει τη μία μεταβλητή και ο κατακόρυφος άξονας την άλλη. Αν ένας μαθητής μελέτησε για ώρες και έγραψε , το σημείο είναι .
Μόλις τα σημεία μπουν στο γράφημα, κοίτα το γενικό μοτίβο:
- Θετική συσχέτιση: τα σημεία τείνουν να ανεβαίνουν από αριστερά προς τα δεξιά.
- Αρνητική συσχέτιση: τα σημεία τείνουν να κατεβαίνουν από αριστερά προς τα δεξιά.
- Μικρή ή καθόλου σαφής συσχέτιση: τα σημεία δεν δείχνουν έντονη γραμμική τάση.
Έλεγξε επίσης για συστάδες, κενά και ακραίες τιμές. Τα πραγματικά δεδομένα σχεδόν ποτέ δεν πέφτουν ακριβώς πάνω σε μία γραμμή, οπότε ο στόχος είναι να δεις την τάση, όχι την τέλεια ευθυγράμμιση.
Τι σημαίνει η συσχέτιση σε ένα διάγραμμα διασποράς
Η συσχέτιση περιγράφει την κατεύθυνση και την ισχύ μιας γραμμικής σχέσης. Το «γραμμική» είναι η βασική προϋπόθεση: η συσχέτιση συνοψίζει πόσο καλά τα σημεία ταιριάζουν σε μια τάση ευθείας γραμμής.
Αν τα σημεία συγκεντρώνονται γύρω από μια ευθεία με ανοδική κλίση, η συσχέτιση είναι θετική. Αν συγκεντρώνονται γύρω από μια ευθεία με καθοδική κλίση, η συσχέτιση είναι αρνητική. Αν τα σημεία φαίνονται διάσπαρτα χωρίς σαφή ευθύγραμμη κατεύθυνση, η γραμμική συσχέτιση είναι ασθενής ή κοντά στο μηδέν.
Ένα καμπύλο μοτίβο μπορεί πάλι να δείχνει πραγματική σχέση. Απλώς μπορεί να μην έχει ισχυρή γραμμική συσχέτιση.
Πότε βοηθά μια ευθεία καλύτερης προσαρμογής
Μια ευθεία καλύτερης προσαρμογής είναι μια ευθεία γραμμή που σχεδιάζεται για να αναπαριστά τη γενική τάση των σημείων. Δεν χρειάζεται να περνά από κάθε σημείο. Ο ρόλος της είναι να μένει συνολικά κοντά στο νέφος των σημείων.
Χρησιμοποίησε ευθεία καλύτερης προσαρμογής μόνο όταν το διάγραμμα διασποράς είναι περίπου γραμμικό. Σε αυτή την περίπτωση, η ευθεία βοηθά σε δύο πράγματα:
- στη σύνοψη της τάσης
- στην προσέγγιση προβλέψεων μέσα στο παρατηρούμενο εύρος
Αν το μοτίβο είναι καμπύλο, χωρίζεται σε συστάδες ή επηρεάζεται έντονα από ακραίες τιμές, μια ευθεία καλύτερης προσαρμογής μπορεί να κρύβει περισσότερα απ’ όσα εξηγεί.
Παράδειγμα διαγράμματος διασποράς: ώρες μελέτης και βαθμοί κουίζ
Υποθέστε ότι ένας καθηγητής καταγράφει τον χρόνο μελέτης και τον βαθμό σε κουίζ για πέντε μαθητές:
Αυτά τα σημεία ανεβαίνουν από αριστερά προς τα δεξιά και μένουν αρκετά κοντά σε μια ευθεία γραμμή. Αυτό σημαίνει ότι η σχέση είναι θετική και περίπου γραμμική.
Άρα τόσο η συσχέτιση όσο και μια ευθεία καλύτερης προσαρμογής είναι λογικές συνόψεις εδώ. Θα περίμενες η ευθεία καλύτερης προσαρμογής να έχει θετική κλίση, επειδή μεγαλύτεροι χρόνοι μελέτης τείνουν να συνδέονται με υψηλότερους βαθμούς στο κουίζ.
Τώρα πρόσθεσε ένα ακόμη σημείο στο . Η τάση μπορεί να παραμένει θετική, αλλά αυτό το σημείο είναι ακραία τιμή και μπορεί να τραβήξει την ευθεία καλύτερης προσαρμογής προς τα κάτω. Γι’ αυτό το γράφημα πρέπει να προηγείται της σύνοψης: η εικόνα σου λέει αν μπορείς να εμπιστευτείς τη σύνοψη.
Συνηθισμένα λάθη στα διαγράμματα διασποράς
Να θεωρείς τη συσχέτιση αιτιότητα
Αν δύο μεταβλητές μεταβάλλονται μαζί, αυτό δεν σημαίνει αυτόματα ότι η μία προκαλεί την άλλη. Ένας τρίτος παράγοντας μπορεί να επηρεάζει και τις δύο, ή το μοτίβο μπορεί να είναι πιο σύνθετο απ’ όσο φαίνεται αρχικά.
Να επιβάλλεις μια ευθεία σε καμπύλο μοτίβο
Μερικά δεδομένα ακολουθούν καμπύλη και όχι ευθεία γραμμή. Σε αυτή την περίπτωση, μια γραμμική ευθεία καλύτερης προσαρμογής μπορεί να δώσει παραπλανητική σύνοψη.
Να αγνοείς τις ακραίες τιμές
Ένα ασυνήθιστο σημείο μπορεί να αλλάξει πολύ τη φαινομενική τάση. Οι ακραίες τιμές δεν σημαίνουν πάντα ότι τα δεδομένα είναι λάθος, αλλά δεν πρέπει ποτέ να αγνοούνται χωρίς να ελέγχεται το πλαίσιο.
Να ξεχνάς τι παριστάνει ένα σημείο
Ένα διάγραμμα διασποράς λειτουργεί μόνο για ζευγαρωμένα δεδομένα. Κάθε σημείο πρέπει να προέρχεται από μία παρατήρηση που έχει και τιμή και τιμή .
Πότε χρησιμοποιούνται τα διαγράμματα διασποράς
Τα διαγράμματα διασποράς χρησιμοποιούνται στη στατιστική, στις επιστήμες, στις επιχειρήσεις και στην κοινωνική έρευνα όποτε θέλεις να συγκρίνεις δύο αριθμητικές μεταβλητές. Συνηθισμένα παραδείγματα είναι το ύψος και το βάρος, η διαφημιστική δαπάνη και οι πωλήσεις, ή ο χρόνος μελέτης και ο βαθμός στο τεστ.
Είναι ιδιαίτερα χρήσιμα στην αρχή μιας ανάλυσης, επειδή μπορούν να αποκαλύψουν μοτίβα που ένας μόνο τύπος μπορεί να κρύβει, όπως συστάδες, κενά ή ακραίες τιμές.
Δοκίμασε ένα παρόμοιο πρόβλημα
Πάρε ένα μικρό σύνολο ζευγαρωμένων δεδομένων και σχεδίασε τα σημεία πριν υπολογίσεις τη συσχέτιση. Κάνε τρεις ερωτήσεις: το μοτίβο ανεβαίνει ή κατεβαίνει, φαίνεται περίπου γραμμικό και υπάρχουν σημεία ασυνήθιστα μακριά από τα υπόλοιπα;
Αν το μοτίβο φαίνεται περίπου γραμμικό, εξέτασε τα ίδια δεδομένα με έναν συντελεστή συσχέτισης ή με μια απλή ευθεία καλύτερης προσαρμογής. Αυτό είναι το φυσικό επόμενο βήμα από την εικόνα στη σύνοψη.
Χρειάζεσαι βοήθεια με μια άσκηση;
Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.
Άνοιξε το GPAI Solver →