Η συνδιακύμανση μετρά αν δύο μεταβλητές τείνουν να βρίσκονται μαζί πάνω ή κάτω από τους μέσους όρους τους. Θετική συνδιακύμανση σημαίνει ότι οι μεταβλητές συνήθως κινούνται προς την ίδια κατεύθυνση σε σχέση με τους μέσους όρους τους. Αρνητική συνδιακύμανση σημαίνει ότι η μία τείνει να είναι πάνω από τον μέσο όρο όταν η άλλη είναι κάτω από τον δικό της.

Για τους περισσότερους μαθητές, η βασική ιδέα είναι η εξής: το πρόσημο είναι συνήθως πιο χρήσιμο από τον ίδιο τον αριθμό. Το μέγεθος της συνδιακύμανσης εξαρτάται από τις μονάδες και των δύο μεταβλητών, οπότε από μόνο του δεν αποτελεί καθαρή κλίμακα έντασης της σχέσης.

Τύπος Συνδιακύμανσης για Δείγματα και Πληθυσμούς

Για ένα δείγμα ζευγαρωμένων δεδομένων, ένας συνηθισμένος τύπος είναι ο εξής:

sxy=1n1i=1n(xixˉ)(yiyˉ)s_{xy} = \frac{1}{n-1}\sum_{i=1}^n (x_i-\bar{x})(y_i-\bar{y})

Εδώ τα xˉ\bar{x} και yˉ\bar{y} είναι οι δειγματικοί μέσοι όροι. Κάθε γινόμενο (xixˉ)(yiyˉ)(x_i-\bar{x})(y_i-\bar{y}) είναι θετικό όταν το ζεύγος βρίσκεται στην ίδια πλευρά και των δύο μέσων όρων, και αρνητικό όταν βρίσκεται σε αντίθετες πλευρές.

Αν εργάζεστε με ολόκληρο πληθυσμό και όχι με δείγμα, ο παρονομαστής είναι συνήθως NN αντί για n1n-1:

Cov(X,Y)=1Ni=1N(xiμx)(yiμy)\mathrm{Cov}(X,Y) = \frac{1}{N}\sum_{i=1}^N (x_i-\mu_x)(y_i-\mu_y)

Χρησιμοποιήστε τη δειγματική εκδοχή για δεδομένα δείγματος και την εκδοχή πληθυσμού μόνο όταν τα δεδομένα αντιπροσωπεύουν ολόκληρο τον πληθυσμό που θέλετε να περιγράψετε.

Πώς να Διαβάζετε το Πρόσημο της Συνδιακύμανσης

Η συνδιακύμανση βασίζεται στις ζευγαρωμένες αποκλίσεις από τον μέσο όρο.

Αν και οι δύο αποκλίσεις είναι θετικές, το γινόμενό τους είναι θετικό. Αν και οι δύο είναι αρνητικές, το γινόμενο είναι επίσης θετικό. Αυτά τα ζεύγη αυξάνουν τη συνδιακύμανση, επειδή οι μεταβλητές κινούνται μαζί σε σχέση με τα κέντρα τους.

Αν η μία απόκλιση είναι θετική και η άλλη αρνητική, το γινόμενο είναι αρνητικό. Αυτά τα ζεύγη μειώνουν τη συνδιακύμανση, επειδή οι μεταβλητές κινούνται σε αντίθετες κατευθύνσεις.

Άρα η συνδιακύμανση είναι ουσιαστικά ένας μέσος όρος της «κοινής κίνησης γύρω από τον μέσο όρο».

Λυμένο Παράδειγμα: Ώρες Μελέτης και Βαθμοί Κουίζ

Ας υποθέσουμε ότι ένα μικρό δείγμα καταγράφει ώρες μελέτης και βαθμούς σε κουίζ:

(1,70), (2,80), (3,90)(1,70),\ (2,80),\ (3,90)

Πρώτα βρίσκουμε τους μέσους όρους:

xˉ=1+2+33=2\bar{x} = \frac{1+2+3}{3} = 2 yˉ=70+80+903=80\bar{y} = \frac{70+80+90}{3} = 80

Τώρα υπολογίζουμε τις αποκλίσεις και τα γινόμενά τους:

  • Για το (1,70)(1,70): (12)(7080)=(1)(10)=10(1-2)(70-80) = (-1)(-10) = 10
  • Για το (2,80)(2,80): (22)(8080)=0(2-2)(80-80) = 0
  • Για το (3,90)(3,90): (32)(9080)=(1)(10)=10(3-2)(90-80) = (1)(10) = 10

Προσθέτουμε τα γινόμενα:

10+0+10=2010 + 0 + 10 = 20

Επειδή πρόκειται για δειγματική συνδιακύμανση, διαιρούμε με n1=2n-1 = 2:

sxy=202=10s_{xy} = \frac{20}{2} = 10

Η συνδιακύμανση είναι θετική, άρα οι μεταβλητές κινούνται μαζί σε αυτό το δείγμα. Εδώ, περισσότερος χρόνος μελέτης συνδέεται με υψηλότερους βαθμούς στο κουίζ.

Η σημαντική προειδοποίηση είναι ότι το 1010 δεν αποτελεί μια καθολική κλίμακα έντασης. Το μέγεθός του εξαρτάται από τις μονάδες εδώ: ώρες επί μονάδες βαθμολογίας. Αν αλλάζατε την κλίμακα μέτρησης, η συνδιακύμανση θα άλλαζε επίσης, ακόμη κι αν το συνολικό μοτίβο έμενε παρόμοιο.

Συνδιακύμανση vs Συσχέτιση: Η Βασική Διαφορά

Η συνδιακύμανση και η συσχέτιση συνδέονται στενά, αλλά απαντούν σε ελαφρώς διαφορετικά ερωτήματα.

Η συνδιακύμανση δείχνει την κατεύθυνση της κοινής μεταβολής και διατηρεί την αρχική κλίμακα. Η συσχέτιση τυποποιεί αυτή τη σχέση διαιρώντας τη συνδιακύμανση με τις τυπικές αποκλίσεις, όταν αυτές οι τυπικές αποκλίσεις είναι μη μηδενικές:

r=sxysxsyr = \frac{s_{xy}}{s_x s_y}

Γι’ αυτό η συσχέτιση δεν έχει μονάδες και είναι πιο εύκολο να συγκριθεί μεταξύ διαφορετικών συνόλων δεδομένων. Η τιμή της παραμένει μεταξύ 1-1 και 11, ενώ η συνδιακύμανση δεν έχει σταθερό εύρος τιμών.

Στην πράξη:

  • Χρησιμοποιήστε τη συνδιακύμανση όταν σας ενδιαφέρει η κοινή μεταβολή στις αρχικές μονάδες ή όταν εμφανίζεται μέσα σε έναν μεγαλύτερο υπολογισμό, όπως σε έναν πίνακα συνδιακυμάνσεων.
  • Χρησιμοποιήστε τη συσχέτιση όταν θέλετε μια περίληψη χωρίς μονάδες, που να συγκρίνεται πιο εύκολα μεταξύ διαφορετικών συνόλων δεδομένων.

Συνηθισμένα Λάθη με τη Συνδιακύμανση

Να Θεωρείτε ότι Μεγάλη Συνδιακύμανση Σημαίνει Αυτόματα Ισχυρή Σχέση

Μια συνδιακύμανση ίση με 100100 δεν είναι αυτόματα «ισχυρότερη» από μια συνδιακύμανση ίση με 55. Οι μεταβλητές μπορεί απλώς να μετρώνται σε μεγαλύτερες κλίμακες.

Σύγχυση Μεταξύ Τύπων για Δείγμα και Πληθυσμό

Αν τα δεδομένα σας είναι δείγμα, το να διαιρείτε με n1n-1 είναι το τυπικό. Αν τα δεδομένα σας είναι ολόκληρος ο πληθυσμός που σας ενδιαφέρει, τότε η διαίρεση με NN είναι η εκδοχή πληθυσμού.

Να Νομίζετε ότι Μηδενική Συνδιακύμανση Σημαίνει Καμία Σχέση

Συνδιακύμανση κοντά στο 00 σημαίνει μικρή γραμμική συν-μεταβολή γύρω από τους μέσους όρους. Δεν αποκλείει όμως μια μη γραμμική σχέση.

Αν δύο μεταβλητές είναι ανεξάρτητες και η συνδιακύμανση υπάρχει, τότε η συνδιακύμανση είναι 00. Το αντίστροφο δεν ισχύει πάντα.

Να Ερμηνεύετε τη Συνδιακύμανση ως Αιτιότητα

Η συνδιακύμανση περιγράφει μόνο πώς μεταβάλλονται μαζί οι μεταβλητές. Δεν εξηγεί γιατί μεταβάλλονται μαζί.

Πού Χρησιμοποιείται η Συνδιακύμανση

Η συνδιακύμανση εμφανίζεται στη στατιστική, στα χρηματοοικονομικά, στη μηχανική μάθηση και στην ανάλυση δεδομένων, κάθε φορά που πρέπει να μελετηθούν μαζί ζευγαρωμένες μεταβλητές.

Είναι ιδιαίτερα συνηθισμένη στους πίνακες συνδιακυμάνσεων, όπου κάθε στοιχείο συνοψίζει πώς δύο μεταβλητές μεταβάλλονται από κοινού. Αυτό έχει σημασία σε τομείς όπως ο κίνδυνος χαρτοφυλακίου, η ανάλυση κύριων συνιστωσών και η πολυμεταβλητή μοντελοποίηση.

Δοκιμάστε ένα Παρόμοιο Πρόβλημα

Πάρτε οποιεσδήποτε τρεις ή τέσσερις ζευγαρωμένες τιμές, υπολογίστε τους δύο μέσους όρους και μετά πολλαπλασιάστε τις ζευγαρωμένες αποκλίσεις πριν πάρετε τον μέσο όρο τους. Αυτή η απλή διαδικασία κάνει το πρόσημο της συνδιακύμανσης πολύ πιο συγκεκριμένο.

Αν θέλετε το επόμενο βήμα, συγκρίνετε τα ίδια δεδομένα με τον συντελεστή συσχέτισης και παρατηρήστε πώς η τυποποίηση των κλιμάκων αλλάζει την ερμηνεία.

Χρειάζεσαι βοήθεια με μια άσκηση;

Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.

Άνοιξε το GPAI Solver →