Die Varianz misst, wie stark Zahlen um ihren Mittelwert streuen. Eine kleine Varianz bedeutet, dass die Werte ziemlich nah am Mittelwert liegen. Eine große Varianz bedeutet, dass sie stärker verteilt sind.
Um die Varianz zu berechnen, bestimmst du, wie weit jeder Wert vom Mittelwert entfernt ist, quadrierst diese Abstände und bildest dann den Durchschnitt. Das Quadrieren ist wichtig, weil sich positive und negative Abweichungen sonst gegenseitig aufheben würden.
Varianzformel: Grundgesamtheit vs. Stichprobe
Verwende die Formel für die Varianz der Grundgesamtheit, wenn deine Daten jeden Wert der Gruppe enthalten, die du beschreiben möchtest:
Verwende die Formel für die Stichprobenvarianz, wenn deine Daten nur eine Stichprobe sind und du die Streuung einer größeren Grundgesamtheit schätzen möchtest:
Der einzige Unterschied ist der Nenner. Verwende für eine vollständige Grundgesamtheit. Verwende für eine Schätzung auf Basis einer Stichprobe.
Was die Varianz bedeutet
Die Varianz sagt dir nicht, wo das Zentrum liegt. Sie sagt dir, wie weit die Daten im Allgemeinen von diesem Zentrum entfernt liegen.
Wenn zwei Datensätze denselben Mittelwert haben, dann hat der mit der größeren Varianz im Durchschnitt Werte, die weiter vom Mittelwert entfernt sind. Weil die Abweichungen quadriert werden, haben ungewöhnlich große Abstände einen zusätzlichen Einfluss.
Ein wichtiges Detail: Die Varianz wird in quadrierten Einheiten gemessen. Wenn die Daten in Metern angegeben sind, dann ist die Varianz in Quadratmetern. Deshalb ist die Standardabweichung im Alltag oft leichter zu interpretieren.
So berechnest du die Varianz: Durchgerechnetes Beispiel
Verwende den Datensatz .
Bestimme zuerst den Mittelwert:
Ziehe nun von jedem Wert den Mittelwert ab und quadriere das Ergebnis:
Addiere diese quadrierten Abweichungen:
Wenn diese acht Werte die vollständige Grundgesamtheit sind, dann ist die Varianz der Grundgesamtheit:
Wenn dieselben acht Werte als Stichprobe aus einer größeren Grundgesamtheit betrachtet werden, dann ist die Stichprobenvarianz:
Dieses Beispiel zeigt die Grundidee deutlich: Die quadrierten Abweichungen sind gleich, aber das Endergebnis ändert sich je nachdem, ob du durch oder durch teilst.
Häufige Fehler bei der Varianz
- Vergessen, die Abweichungen zu quadrieren. Wenn du rohe Abweichungen mittelt, heben sich positive und negative Werte auf, sodass die Streuung nicht mehr korrekt gemessen wird.
- Varianz der Grundgesamtheit und Stichprobenvarianz verwechseln. Teile durch bei einer vollständigen Grundgesamtheit und durch bei einer Stichprobe, die eine größere Grundgesamtheit schätzen soll.
- Vergessen, dass die Varianz quadrierte Einheiten verwendet. Die Varianz ist nützlich, aber die Standardabweichung ist oft leichter zu lesen, weil sie wieder in den ursprünglichen Einheiten angegeben wird.
- Annehmen, dass eine große Varianz immer schlecht ist. Eine größere Varianz bedeutet nur mehr Streuung. Ob das wichtig ist, hängt vom Kontext ab.
Wann die Varianz verwendet wird
Die Varianz wird immer dann verwendet, wenn du Streuung auf konsistente Weise beschreiben oder vergleichen möchtest.
- In der Statistik hilft sie dabei, zusammenzufassen, wie stark ein Datensatz gestreut ist.
- In der Qualitätskontrolle kann sie helfen zu verfolgen, ob ein Prozess über die Zeit hinweg konstant bleibt.
- In der Finanzwelt wird die Varianz verwendet, um zu beschreiben, wie stark Renditen schwanken, auch wenn sie nur eine von mehreren Möglichkeiten ist, über Risiko nachzudenken.
- Im maschinellen Lernen und in der Datenanalyse hilft sie zu beschreiben, wie Merkmale oder Fehler über Beobachtungen hinweg variieren.
Probiere eine ähnliche Aufgabe
Probiere deine eigene Version mit zwei kleinen Datensätzen, die denselben Mittelwert, aber eine unterschiedliche Streuung haben. Berechne für beide die Varianz und prüfe, ob der stärker gestreute Datensatz den größeren Wert erhält. Dieser eine Vergleich sorgt meist dafür, dass die Idee hängen bleibt.
Brauchst du Hilfe bei einer Aufgabe?
Lade deine Frage hoch und erhalte in Sekunden eine verifizierte Schritt-für-Schritt-Lösung.
GPAI Solver öffnen →