Statistik - Korrelationskoeffizient

Korrelationskoeffizient

Ein Korrelationskoeffizient ist ein statistisches Maß für den Grad, in dem Änderungen am Wert einer Variablen eine Änderung am Wert einer anderen Variablen vorhersagen. Bei positiv korrelierten Variablen nimmt der Wert gleichzeitig zu oder ab. In negativ korrelierten Variablen nimmt der Wert der einen zu, während der Wert der anderen abnimmt.

Korrelationskoeffizienten werden als Werte zwischen +1 und -1 ausgedrückt.

Ein Koeffizient von +1 zeigt eine perfekte positive Korrelation an: Eine Änderung des Werts einer Variablen sagt eine Änderung in der gleichen Richtung in der zweiten Variablen voraus.

Ein Koeffizient von -1 zeigt ein perfektes Negativ an: Eine Änderung des Werts einer Variablen sagt eine Änderung der zweiten Variablen in die entgegengesetzte Richtung voraus. Geringere Korrelationsgrade werden als Dezimalstellen ungleich Null ausgedrückt. Ein Koeffizient von Null zeigt an, dass es keinen erkennbaren Zusammenhang zwischen den Schwankungen der Variablen gibt.

Formel

$ {r = \ frac {N \ sum xy - (\ sum x) (\ sum y)} {\ sqrt {[N \ sum x ^ 2 - (\ sum x) ^ 2] [N \ sum y ^ 2 - (\ sum y) ^ 2]}}} $

Wo -

  • $ {N} $ = Anzahl der Punktepaare

  • $ {\ sum xy} $ = Summe der Produkte gepaarter Punktzahlen.

  • $ {\ sum x} $ = Summe von x Punkten.

  • $ {\ sum y} $ = Summe der y Punkte.

  • $ {\ sum x ^ 2} $ = Summe der quadrierten x Punkte.

  • $ {\ sum y ^ 2} $ = Summe der quadratischen y-Werte.

Beispiel

Problemstellung:

Berechnen Sie den Korrelationskoeffizienten für Folgendes:

X Y.
1 2
3 5
4 5
4 8

Lösung:

$ {\ sum xy = (1) (2) + (3) (5) + (4) (5) + (4) (8) = 69 \\ [7pt] \ sum x = 1 + 3 + 4 + 4 = 12 \\ [7pt] \ sum y = 2 + 5 + 5 + 8 = 20 \\ [7pt] \ sum x ^ 2 = 1 ^ 2 + 3 ^ 2 + 4 ^ 2 + 4 ^ 2 = 42 \ \ [7pt] \ sum y ^ 2 = 2 ^ 2 + 5 ^ 2 + 5 ^ 2 + 8 ^ 2 = 118 \\ [7pt] r = \ frac {69 - \ frac {(12) (20)} { 4}} {\ sqrt {(42 - \ frac {(12) ^ 2} {4}) (118- \ frac {(20) ^ 2} {4}} \\ [7pt] = .866} $