Die Kovarianz misst, ob zwei Variablen dazu neigen, gemeinsam über oder unter ihren Mittelwerten zu liegen. Eine positive Kovarianz bedeutet, dass sich die Variablen relativ zu ihren Durchschnittswerten meist in dieselbe Richtung bewegen. Eine negative Kovarianz bedeutet, dass die eine tendenziell über dem Durchschnitt liegt, wenn die andere darunter liegt.

Für die meisten Lernenden ist die wichtigste Idee diese: Das Vorzeichen ist meist nützlicher als die rohe Zahl. Die Größe der Kovarianz hängt von den Einheiten beider Variablen ab und ist daher für sich genommen kein sauberer Maßstab für die Stärke eines Zusammenhangs.

Kovarianz-Formel für Stichproben und Grundgesamtheiten

Für eine Stichprobe gepaarter Daten ist eine gebräuchliche Formel

sxy=1n1i=1n(xixˉ)(yiyˉ)s_{xy} = \frac{1}{n-1}\sum_{i=1}^n (x_i-\bar{x})(y_i-\bar{y})

Hier sind xˉ\bar{x} und yˉ\bar{y} die Stichprobenmittelwerte. Jedes Produkt (xixˉ)(yiyˉ)(x_i-\bar{x})(y_i-\bar{y}) ist positiv, wenn das Paar auf derselben Seite beider Mittelwerte liegt, und negativ, wenn die Werte auf entgegengesetzten Seiten liegen.

Wenn du mit einer vollständigen Grundgesamtheit statt mit einer Stichprobe arbeitest, ist der Nenner typischerweise NN statt n1n-1:

Cov(X,Y)=1Ni=1N(xiμx)(yiμy)\mathrm{Cov}(X,Y) = \frac{1}{N}\sum_{i=1}^N (x_i-\mu_x)(y_i-\mu_y)

Verwende die Stichprobenversion für Stichprobendaten und die Populationsversion nur dann, wenn die Daten die gesamte Grundgesamtheit darstellen, die du beschreiben willst.

So liest du das Vorzeichen der Kovarianz

Die Kovarianz wird aus gepaarten Abweichungen vom Mittelwert gebildet.

Sind beide Abweichungen positiv, ist ihr Produkt positiv. Sind beide negativ, ist ihr Produkt ebenfalls positiv. Solche Paare erhöhen die Kovarianz, weil sich die Variablen relativ zu ihren Mittelpunkten gemeinsam bewegen.

Ist eine Abweichung positiv und die andere negativ, ist das Produkt negativ. Solche Paare ziehen die Kovarianz nach unten, weil sich die Variablen in entgegengesetzte Richtungen bewegen.

Die Kovarianz ist also im Grunde ein Durchschnitt der „gemeinsamen Bewegung um den Mittelwert“.

Durchgerechnetes Beispiel: Lernstunden und Quizpunkte

Angenommen, eine kleine Stichprobe erfasst Lernstunden und Quizpunkte:

(1,70), (2,80), (3,90)(1,70),\ (2,80),\ (3,90)

Bestimme zuerst die Mittelwerte:

xˉ=1+2+33=2\bar{x} = \frac{1+2+3}{3} = 2 yˉ=70+80+903=80\bar{y} = \frac{70+80+90}{3} = 80

Berechne nun die Abweichungen und ihre Produkte:

  • Für (1,70)(1,70): (12)(7080)=(1)(10)=10(1-2)(70-80) = (-1)(-10) = 10
  • Für (2,80)(2,80): (22)(8080)=0(2-2)(80-80) = 0
  • Für (3,90)(3,90): (32)(9080)=(1)(10)=10(3-2)(90-80) = (1)(10) = 10

Addiere die Produkte:

10+0+10=2010 + 0 + 10 = 20

Da es sich um eine Stichprobenkovarianz handelt, teile durch n1=2n-1 = 2:

sxy=202=10s_{xy} = \frac{20}{2} = 10

Die Kovarianz ist positiv, also bewegen sich die Variablen in dieser Stichprobe gemeinsam. Mehr Lernzeit geht hier mit höheren Quizpunkten einher.

Die wichtige Vorsicht ist, dass 1010 kein universeller Maßstab für die Stärke ist. Seine Größe hängt hier von den Einheiten ab: Stunden mal Punktzahl. Wenn du die Messskala ändern würdest, würde sich auch die Kovarianz ändern, selbst wenn das Gesamtmuster ähnlich bliebe.

Kovarianz vs. Korrelation: Der wichtigste Unterschied

Kovarianz und Korrelation sind eng verwandt, beantworten aber leicht unterschiedliche Fragen.

Die Kovarianz zeigt dir die Richtung der gemeinsamen Bewegung und behält die ursprüngliche Skala bei. Die Korrelation standardisiert diesen Zusammenhang, indem sie die Kovarianz durch die Standardabweichungen teilt, sofern diese Standardabweichungen nicht null sind:

r=sxysxsyr = \frac{s_{xy}}{s_x s_y}

Deshalb ist die Korrelation einheitslos und zwischen verschiedenen Datensätzen leichter vergleichbar. Ihr Wert liegt immer zwischen 1-1 und 11, während die Kovarianz keinen festen Wertebereich hat.

In der Praxis:

  • Verwende die Kovarianz, wenn dich die gemeinsame Variation in den ursprünglichen Einheiten interessiert oder wenn sie in einer größeren Rechnung vorkommt, etwa in einer Kovarianzmatrix.
  • Verwende die Korrelation, wenn du eine einheitslose Zusammenfassung möchtest, die sich zwischen Datensätzen leichter vergleichen lässt.

Häufige Fehler bei der Kovarianz

Eine große Kovarianz automatisch als stark ansehen

Eine Kovarianz von 100100 ist nicht automatisch „stärker“ als eine Kovarianz von 55. Die Variablen könnten einfach auf größeren Skalen gemessen worden sein.

Stichproben- und Populationsformeln verwechseln

Wenn deine Daten eine Stichprobe sind, ist das Teilen durch n1n-1 Standard. Wenn deine Daten die gesamte relevante Grundgesamtheit sind, teilst du durch NN.

Denken, dass Kovarianz null bedeutet, dass überhaupt kein Zusammenhang besteht

Eine Kovarianz nahe 00 bedeutet wenig lineare gemeinsame Bewegung um die Mittelwerte. Sie schließt einen nichtlinearen Zusammenhang nicht aus.

Wenn zwei Variablen unabhängig sind und die Kovarianz existiert, dann ist die Kovarianz 00. Die Umkehrung gilt aber nicht immer.

Kovarianz als Kausalität lesen

Die Kovarianz beschreibt nur, wie Variablen gemeinsam variieren. Sie erklärt nicht, warum sie gemeinsam variieren.

Wann die Kovarianz verwendet wird

Die Kovarianz taucht in Statistik, Finanzwesen, maschinellem Lernen und Datenanalyse auf, wenn gepaarte Variablen gemeinsam untersucht werden sollen.

Besonders häufig ist sie in Kovarianzmatrizen, in denen jeder Eintrag zusammenfasst, wie zwei Variablen gemeinsam variieren. Das ist wichtig in Bereichen wie Portfoliorisiko, Hauptkomponentenanalyse und multivariabler Modellierung.

Probiere eine ähnliche Aufgabe

Nimm drei oder vier beliebige Wertepaaren, berechne die beiden Mittelwerte und multipliziere dann die gepaarten Abweichungen, bevor du sie mittelt. Diese eine Routine macht das Vorzeichen der Kovarianz viel greifbarer.

Wenn du den nächsten Schritt gehen willst, vergleiche dieselben Daten mit dem Korrelationskoeffizienten und achte darauf, wie die Standardisierung der Skalen die Interpretation verändert.

Brauchst du Hilfe bei einer Aufgabe?

Lade deine Frage hoch und erhalte in Sekunden eine verifizierte Schritt-für-Schritt-Lösung.

GPAI Solver öffnen →