Η αθροιστική συχνότητα είναι το διαδοχικό άθροισμα σε έναν πίνακα συχνοτήτων. Σου δείχνει πόσες παρατηρήσεις είναι σε ή κάτω από μια τιμή ή ένα όριο κλάσης, γι’ αυτό είναι χρήσιμη για την εύρεση της διαμέσου, των τεταρτημορίων και των εκατοστημορίων.

Η καμπύλη ogive είναι το γράφημα αυτού του διαδοχικού αθροίσματος. Μόλις μάθεις να διαβάζεις μαζί τον πίνακα και το γράφημα, οι ασκήσεις με ομαδοποιημένα δεδομένα γίνονται πολύ πιο εύκολες.

Ορισμός της Αθροιστικής Συχνότητας

Αν οι συχνότητες των κλάσεων είναι f1,f2,,fkf_1, f_2, \dots, f_k, τότε η αθροιστική συχνότητα μέχρι την κλάση kk είναι

Fk=f1+f2++fkF_k = f_1 + f_2 + \cdots + f_k

Κάθε γραμμή προσθέτει άλλη μία κλάση στο συνολικό άθροισμα. Αν η αθροιστική συχνότητα είναι 2828 στο τέλος μιας κλάσης, τότε 2828 παρατηρήσεις βρίσκονται σε αυτή την κλάση ή σε κάποια προηγούμενη.

Για μη ομαδοποιημένα δεδομένα, η αθροιστική συχνότητα είναι απλώς μια διαδοχική καταμέτρηση. Για ομαδοποιημένα δεδομένα, είναι μια διαδοχική καταμέτρηση ανά διάστημα κλάσης.

Πώς η Καμπύλη Ogive Βοηθά να Διαβάζεις Εκατοστημόρια

Μια καμπύλη ogive παριστάνει την αθροιστική συχνότητα ως προς τα όρια των κλάσεων. Για ομαδοποιημένα συνεχή δεδομένα, συνήθως τοποθετείς:

  • το άνω όριο της κλάσης στον οριζόντιο άξονα
  • την αθροιστική συχνότητα στον κατακόρυφο άξονα

Έπειτα ενώνεις τα σημεία με μια ομαλή ή τμηματική γραμμή. Η καμπύλη ανεβαίνει, επειδή η αθροιστική συχνότητα δεν μειώνεται ποτέ.

Η βασική χρήση μιας καμπύλης ogive είναι η ανάγνωση θέσεων στο διατεταγμένο σύνολο δεδομένων. Αν η συνολική συχνότητα είναι NN, τότε:

  • η διάμεσος είναι περίπου η N/2N/2οστή τιμή
  • το πρώτο τεταρτημόριο είναι περίπου η N/4N/4οστή τιμή
  • το τρίτο τεταρτημόριο είναι περίπου η 3N/43N/4οστή τιμή
  • το ppοστό εκατοστημόριο είναι περίπου η (p/100)N(p/100)Nοστή τιμή

Στο γράφημα, ξεκινάς από αυτή την κατακόρυφη θέση, κινείσαι οριζόντια μέχρι την καμπύλη ogive και μετά κατεβαίνεις στον οριζόντιο άξονα για να εκτιμήσεις την τιμή.

Λυμένο Παράδειγμα: Διάμεσος και 75ο Εκατοστημόριο

Ας υποθέσουμε ότι οι βαθμολογίες ενός τεστ για 4040 μαθητές είναι ομαδοποιημένες ως εξής:

Βαθμολογία Συχνότητα Αθροιστική συχνότητα
0-10 22 22
10-20 55 77
20-30 99 1616
30-40 1212 2828
40-50 88 3636
50-60 44 4040

Η συνολική συχνότητα είναι N=40N = 40.

Βρες τη διάμεσο από τον πίνακα

Η διάμεσος είναι η N/2=20N/2 = 20οστή τιμή.

Κοίτα τις αθροιστικές συχνότητες:

  • μέχρι το 20-30, το σύνολο είναι 1616
  • μέχρι το 30-40, το σύνολο είναι 2828

Άρα η 2020οστή τιμή βρίσκεται στην κλάση 3030-4040.

Αν θέλεις μια εκτίμηση για ομαδοποιημένα δεδομένα, χρησιμοποίησε παρεμβολή μόνο αν είναι λογικό να θεωρήσεις ότι οι τιμές κατανέμονται αρκετά ομοιόμορφα μέσα σε εκείνη την κλάση. Τότε

medianL+N/2Fbeforefw\text{median} \approx L + \frac{N/2 - F_{\text{before}}}{f} \cdot w

Εδώ:

  • L=30L = 30 είναι το κάτω όριο της κλάσης
  • Fbefore=16F_{\text{before}} = 16 είναι η αθροιστική συχνότητα πριν από την κλάση
  • f=12f = 12 είναι η συχνότητα της κλάσης
  • w=10w = 10 είναι το πλάτος της κλάσης

Άρα

median30+20161210=30+401233.3\text{median} \approx 30 + \frac{20 - 16}{12} \cdot 10 = 30 + \frac{40}{12} \approx 33.3

Αυτή η εκτίμηση δεν είναι ακριβής. Εξαρτάται από την υπόθεση ότι οι τιμές μέσα στην κλάση 3030-4040 κατανέμονται αρκετά ομαλά.

Εκτίμησε το 75ο εκατοστημόριο

Το 7575ο εκατοστημόριο είναι η (75/100)40=30(75/100) \cdot 40 = 30οστή τιμή.

Από τις αθροιστικές συχνότητες:

  • μέχρι το 30-40, το σύνολο είναι 2828
  • μέχρι το 40-50, το σύνολο είναι 3636

Άρα η 3030οστή τιμή βρίσκεται στην κλάση 4040-5050.

Χρησιμοποιώντας την ίδια ιδέα παρεμβολής,

P7540+3028810=42.5P_{75} \approx 40 + \frac{30 - 28}{8} \cdot 10 = 42.5

Σε μια καμπύλη ogive, θα σημείωνες το 3030 στον άξονα της αθροιστικής συχνότητας, θα κινούσουν οριζόντια μέχρι την καμπύλη και μετά θα διάβαζες προς τα κάτω περίπου το 42.542.5 στον άξονα της βαθμολογίας.

Συνηθισμένα Λάθη με την Αθροιστική Συχνότητα

Σύγχυση ανάμεσα στη συχνότητα και την αθροιστική συχνότητα

Η συχνότητα δείχνει πόσες παρατηρήσεις υπάρχουν σε μία κλάση. Η αθροιστική συχνότητα δείχνει πόσες παρατηρήσεις υπάρχουν σε αυτή την κλάση και σε όλες τις προηγούμενες μαζί.

Χρήση λανθασμένης θέσης

Για τη διάμεσο ή ένα εκατοστημόριο, η θέση προκύπτει από τη συνολική συχνότητα NN. Αν χρησιμοποιήσεις λάθος σύνολο, κάθε επόμενο βήμα θα είναι λάθος.

Αντιμετώπιση των ομαδοποιημένων εκτιμήσεων ως ακριβών

Μια καμπύλη ogive ή η παρεμβολή δίνει μια εκτίμηση μέσα σε μια κλάση, όχι μια ακριβή αρχική τιμή δεδομένων. Αυτή η εκτίμηση εξαρτάται από το πώς κατανέμονται τα δεδομένα μέσα στο διάστημα.

Σχεδίαση λανθασμένων οριζόντιων τιμών

Για ομαδοποιημένα δεδομένα, οι καμπύλες ogive συνήθως σχεδιάζονται ως προς τα όρια των κλάσεων, ειδικά τα άνω όρια. Η σχεδίαση ως προς τα μέσα των κλάσεων αλλάζει το νόημα.

Πότε Χρησιμοποιείται η Αθροιστική Συχνότητα

Η αθροιστική συχνότητα χρησιμοποιείται κάθε φορά που χρειάζεσαι τη διατεταγμένη θέση μέσα σε ένα σύνολο δεδομένων και όχι μόνο μετρήσεις ανά κλάση. Αυτό περιλαμβάνει περιλήψεις βαθμολογιών εξετάσεων, κατανομές εισοδήματος, δεδομένα ποιοτικού ελέγχου και κάθε περίπτωση όπου τα εκατοστημόρια ή η διάμεσος έχουν μεγαλύτερη σημασία από τις μεμονωμένες μετρήσεις ανά διάστημα.

Είναι ιδιαίτερα χρήσιμη όταν τα αρχικά δεδομένα είναι πολλά και ένας ομαδοποιημένος πίνακας διαβάζεται πιο εύκολα από μια μεγάλη λίστα παρατηρήσεων.

Δοκίμασε ένα Παρόμοιο Πρόβλημα Αθροιστικής Συχνότητας

Πάρε οποιονδήποτε μικρό ομαδοποιημένο πίνακα και πρόσθεσε μια στήλη αθροιστικής συχνότητας πριν σχεδιάσεις μια καμπύλη ogive. Έπειτα διάβασε τη διάμεσο και ένα εκατοστημόριο από το γράφημα και σύγκρινέ τα με την εκτίμηση από τον πίνακα.

Αν θέλεις έναν ακόμη έλεγχο, δοκίμασε τη δική σου εκδοχή με N=50N = 50 και αναρωτήσου πού θα έπεφταν η 2020ή, η 2525η και η 4545η τιμή. Είναι ένας απλός τρόπος για να εμπεδώσεις την ιδέα.

Χρειάζεσαι βοήθεια με μια άσκηση;

Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.

Άνοιξε το GPAI Solver →