Die Kovarianz misst, ob zwei Variablen dazu neigen, gemeinsam über oder unter ihren Mittelwerten zu liegen. Eine positive Kovarianz bedeutet, dass sich die Variablen relativ zu ihren Durchschnittswerten meist in dieselbe Richtung bewegen. Eine negative Kovarianz bedeutet, dass die eine tendenziell über dem Durchschnitt liegt, wenn die andere darunter liegt.
Für die meisten Lernenden ist die wichtigste Idee diese: Das Vorzeichen ist meist nützlicher als die rohe Zahl. Die Größe der Kovarianz hängt von den Einheiten beider Variablen ab und ist daher für sich genommen kein sauberer Maßstab für die Stärke eines Zusammenhangs.
Kovarianz-Formel für Stichproben und Grundgesamtheiten
Für eine Stichprobe gepaarter Daten ist eine gebräuchliche Formel
Hier sind und die Stichprobenmittelwerte. Jedes Produkt ist positiv, wenn das Paar auf derselben Seite beider Mittelwerte liegt, und negativ, wenn die Werte auf entgegengesetzten Seiten liegen.
Wenn du mit einer vollständigen Grundgesamtheit statt mit einer Stichprobe arbeitest, ist der Nenner typischerweise statt :
Verwende die Stichprobenversion für Stichprobendaten und die Populationsversion nur dann, wenn die Daten die gesamte Grundgesamtheit darstellen, die du beschreiben willst.
So liest du das Vorzeichen der Kovarianz
Die Kovarianz wird aus gepaarten Abweichungen vom Mittelwert gebildet.
Sind beide Abweichungen positiv, ist ihr Produkt positiv. Sind beide negativ, ist ihr Produkt ebenfalls positiv. Solche Paare erhöhen die Kovarianz, weil sich die Variablen relativ zu ihren Mittelpunkten gemeinsam bewegen.
Ist eine Abweichung positiv und die andere negativ, ist das Produkt negativ. Solche Paare ziehen die Kovarianz nach unten, weil sich die Variablen in entgegengesetzte Richtungen bewegen.
Die Kovarianz ist also im Grunde ein Durchschnitt der „gemeinsamen Bewegung um den Mittelwert“.
Durchgerechnetes Beispiel: Lernstunden und Quizpunkte
Angenommen, eine kleine Stichprobe erfasst Lernstunden und Quizpunkte:
Bestimme zuerst die Mittelwerte:
Berechne nun die Abweichungen und ihre Produkte:
- Für :
- Für :
- Für :
Addiere die Produkte:
Da es sich um eine Stichprobenkovarianz handelt, teile durch :
Die Kovarianz ist positiv, also bewegen sich die Variablen in dieser Stichprobe gemeinsam. Mehr Lernzeit geht hier mit höheren Quizpunkten einher.
Die wichtige Vorsicht ist, dass kein universeller Maßstab für die Stärke ist. Seine Größe hängt hier von den Einheiten ab: Stunden mal Punktzahl. Wenn du die Messskala ändern würdest, würde sich auch die Kovarianz ändern, selbst wenn das Gesamtmuster ähnlich bliebe.
Kovarianz vs. Korrelation: Der wichtigste Unterschied
Kovarianz und Korrelation sind eng verwandt, beantworten aber leicht unterschiedliche Fragen.
Die Kovarianz zeigt dir die Richtung der gemeinsamen Bewegung und behält die ursprüngliche Skala bei. Die Korrelation standardisiert diesen Zusammenhang, indem sie die Kovarianz durch die Standardabweichungen teilt, sofern diese Standardabweichungen nicht null sind:
Deshalb ist die Korrelation einheitslos und zwischen verschiedenen Datensätzen leichter vergleichbar. Ihr Wert liegt immer zwischen und , während die Kovarianz keinen festen Wertebereich hat.
In der Praxis:
- Verwende die Kovarianz, wenn dich die gemeinsame Variation in den ursprünglichen Einheiten interessiert oder wenn sie in einer größeren Rechnung vorkommt, etwa in einer Kovarianzmatrix.
- Verwende die Korrelation, wenn du eine einheitslose Zusammenfassung möchtest, die sich zwischen Datensätzen leichter vergleichen lässt.
Häufige Fehler bei der Kovarianz
Eine große Kovarianz automatisch als stark ansehen
Eine Kovarianz von ist nicht automatisch „stärker“ als eine Kovarianz von . Die Variablen könnten einfach auf größeren Skalen gemessen worden sein.
Stichproben- und Populationsformeln verwechseln
Wenn deine Daten eine Stichprobe sind, ist das Teilen durch Standard. Wenn deine Daten die gesamte relevante Grundgesamtheit sind, teilst du durch .
Denken, dass Kovarianz null bedeutet, dass überhaupt kein Zusammenhang besteht
Eine Kovarianz nahe bedeutet wenig lineare gemeinsame Bewegung um die Mittelwerte. Sie schließt einen nichtlinearen Zusammenhang nicht aus.
Wenn zwei Variablen unabhängig sind und die Kovarianz existiert, dann ist die Kovarianz . Die Umkehrung gilt aber nicht immer.
Kovarianz als Kausalität lesen
Die Kovarianz beschreibt nur, wie Variablen gemeinsam variieren. Sie erklärt nicht, warum sie gemeinsam variieren.
Wann die Kovarianz verwendet wird
Die Kovarianz taucht in Statistik, Finanzwesen, maschinellem Lernen und Datenanalyse auf, wenn gepaarte Variablen gemeinsam untersucht werden sollen.
Besonders häufig ist sie in Kovarianzmatrizen, in denen jeder Eintrag zusammenfasst, wie zwei Variablen gemeinsam variieren. Das ist wichtig in Bereichen wie Portfoliorisiko, Hauptkomponentenanalyse und multivariabler Modellierung.
Probiere eine ähnliche Aufgabe
Nimm drei oder vier beliebige Wertepaaren, berechne die beiden Mittelwerte und multipliziere dann die gepaarten Abweichungen, bevor du sie mittelt. Diese eine Routine macht das Vorzeichen der Kovarianz viel greifbarer.
Wenn du den nächsten Schritt gehen willst, vergleiche dieselben Daten mit dem Korrelationskoeffizienten und achte darauf, wie die Standardisierung der Skalen die Interpretation verändert.
Brauchst du Hilfe bei einer Aufgabe?
Lade deine Frage hoch und erhalte in Sekunden eine verifizierte Schritt-für-Schritt-Lösung.
GPAI Solver öffnen →