Die Kovarianz ist ein Maß für den linearen Zusammenhang zweier Zufallsvariablen.
Erklärung
Du kannst die Kovarianz durch folgende Formel berechnen:
(x_i - E(X)) ist die Abweichung der Variablenx von ihrem Erwartungswert
(y_i - E(Y)) ist die Abweichung der Variableny von ihrem Erwartungswert
n ist die Größe der Stichprobe
Du musst also
Als Ergebnis können drei Fälle auftreten:
- Die Kovarianz ist positiv (
Kov(X,Y)>0 ): Linearer Zusammenhang zwischen den Variablen
- Die Kovarianz ist negativ(
Kov(X,Y)<0 ): Antiproportionaler Zusammenhang zwischen den Variablen.
- Die Kovarianz ist
0 : Kein Zusammenhang zwischen den Variablen
Achtung: Die Kovarianz ist nicht standardisiert. Sie gibt im Allgemeinen also keine Auskunft über die Stärke des Zusammenhangs, d.h es gilt nicht: je größer die Kovarianz, desto stärker der Zusammenhang.
Beispiel
Gegeben
Angenommen, du hast fünf Personen zu der Entfernung ihres Wohnorts von ihrem Arbeitsplatz und der Dauer des Arbeitswegs befragt und hast folgende Daten erhalten:
Gesucht
Berechne die Kovarianz zwischen Entfernung und Dauer.
Lösung
Du hast also jeweils fünf Datenpunkte für die Entfernung
Als Erstes berechnest du die Erwartungswerte der beiden Zufallsvariablen:
Hier ist also die Wahrscheinlichkeit jeweils
Dann kannst du die Kovarianz berechnen:
Die Kovarianz ist positiv! Es besteht also ein linearer Zusammenhang zwischen der Entfernung zum Arbeitsort und der Dauer des Arbeitswegs.