Wykres rozrzutu pokazuje zależność między dwiema zmiennymi liczbowymi. Każdy punkt to jedna para wartości, więc można szybko zobaczyć, czy dane rosną, maleją, rozpraszają się, tworzą skupiska albo zawierają nietypowe punkty.
To sprawia, że wykres rozrzutu jest najszybszym sposobem odpowiedzi na pytanie, które naprawdę zadaje sobie większość uczniów: „Co się dzieje w tych danych?”. Zanim obliczysz korelację albo narysujesz linię najlepszego dopasowania, wykres pokazuje, czy takie podsumowania w ogóle mają sens.
Jak odczytywać wykres rozrzutu
Oś pozioma pokazuje jedną zmienną, a oś pionowa drugą. Jeśli jeden uczeń uczył się przez godziny i uzyskał wynik , to punkt ma współrzędne .
Gdy punkty są już naniesione na wykres, szukaj ogólnego wzorca:
- Korelacja dodatnia: punkty mają tendencję do wznoszenia się od lewej do prawej.
- Korelacja ujemna: punkty mają tendencję do opadania od lewej do prawej.
- Mała lub brak wyraźnej korelacji: punkty nie pokazują silnego trendu liniowego.
Sprawdź też skupiska, luki i wartości odstające. Rzeczywiste dane prawie nigdy nie układają się dokładnie na jednej prostej, więc celem jest dostrzeżenie trendu, a nie idealnego dopasowania.
Co oznacza korelacja na wykresie rozrzutu
Korelacja opisuje kierunek i siłę zależności liniowej. „Liniowa” to kluczowy warunek: korelacja podsumowuje to, jak dobrze punkty pasują do trendu wzdłuż prostej.
Jeśli punkty skupiają się wokół prostej rosnącej, korelacja jest dodatnia. Jeśli skupiają się wokół prostej malejącej, korelacja jest ujemna. Jeśli punkty wyglądają na rozproszone i nie mają wyraźnego kierunku wzdłuż prostej, korelacja liniowa jest słaba albo bliska zeru.
Wzorzec krzywoliniowy też może pokazywać rzeczywistą zależność. Po prostu może nie mieć silnej korelacji liniowej.
Kiedy linia najlepszego dopasowania pomaga
Linia najlepszego dopasowania to prosta narysowana tak, aby przedstawiała ogólny trend punktów. Nie musi przechodzić przez każdy punkt. Jej zadaniem jest pozostawać ogólnie blisko chmury punktów.
Używaj linii najlepszego dopasowania tylko wtedy, gdy wykres rozrzutu jest w przybliżeniu liniowy. W takim przypadku linia pomaga w dwóch rzeczach:
- podsumowaniu trendu
- tworzeniu przybliżonych przewidywań w obrębie zaobserwowanego zakresu
Jeśli wzorzec jest krzywoliniowy, podzielony na skupiska albo zdominowany przez wartości odstające, prosta linia najlepszego dopasowania może ukryć więcej, niż wyjaśnia.
Przykład wykresu rozrzutu: czas nauki i wyniki kartkówki
Załóżmy, że nauczyciel zapisuje czas nauki i wynik kartkówki dla pięciu uczniów:
Te punkty wznoszą się od lewej do prawej i pozostają dość blisko prostej. To oznacza, że zależność jest dodatnia i w przybliżeniu liniowa.
Dlatego zarówno korelacja, jak i linia najlepszego dopasowania są tutaj rozsądnymi podsumowaniami. Można oczekiwać, że linia najlepszego dopasowania będzie miała dodatnie nachylenie, ponieważ większy czas nauki zwykle wiąże się z wyższymi wynikami kartkówki.
Teraz dodaj jeszcze jeden punkt w . Trend może nadal być dodatni, ale ten punkt jest wartością odstającą i może pociągnąć linię najlepszego dopasowania w dół. Właśnie dlatego wykres powinien pojawić się przed podsumowaniem: obraz pokazuje, czy podsumowanie jest wiarygodne.
Typowe błędy przy wykresach rozrzutu
Traktowanie korelacji jak związku przyczynowego
Jeśli dwie zmienne zmieniają się razem, nie oznacza to automatycznie, że jedna powoduje drugą. Na obie może wpływać trzeci czynnik albo zależność może być bardziej złożona, niż wydaje się na pierwszy rzut oka.
Dopasowywanie prostej do krzywoliniowego wzorca
Niektóre dane układają się wzdłuż krzywej, a nie prostej. W takim przypadku liniowa linia najlepszego dopasowania może dawać mylące podsumowanie.
Ignorowanie wartości odstających
Jeden nietypowy punkt może mocno zmienić widoczny trend. Wartości odstające nie zawsze oznaczają, że dane są błędne, ale nigdy nie powinno się ich ignorować bez sprawdzenia kontekstu.
Zapominanie, co reprezentuje jeden punkt
Wykres rozrzutu działa tylko dla danych sparowanych. Każdy punkt musi pochodzić z jednej obserwacji, która ma zarówno wartość , jak i wartość .
Kiedy używa się wykresów rozrzutu
Wykresy rozrzutu są używane w statystyce, nauce, biznesie i badaniach społecznych wszędzie tam, gdzie chcesz porównać dwie zmienne liczbowe. Typowe przykłady to wzrost i masa ciała, wydatki na reklamę i sprzedaż albo czas nauki i wynik testu.
Są szczególnie przydatne na początku analizy, ponieważ mogą ujawnić wzorce, które pojedynczy wzór może ukryć, takie jak skupiska, luki czy wartości odstające.
Spróbuj podobnego zadania
Weź mały zestaw danych sparowanych i naszkicuj punkty przed obliczeniem korelacji. Zadaj sobie trzy pytania: czy wzorzec rośnie czy maleje, czy wygląda na w przybliżeniu liniowy i czy jakieś punkty są wyjątkowo daleko od pozostałych?
Jeśli wzorzec wygląda na w przybliżeniu liniowy, zbadaj te same dane za pomocą współczynnika korelacji albo prostej linii najlepszego dopasowania. To naturalny kolejny krok od obrazu do podsumowania.
Potrzebujesz pomocy z zadaniem?
Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.
Otwórz GPAI Solver →