Statistik - Restanalyse

Die Residuenanalyse wird verwendet, um die Angemessenheit eines linearen Regressionsmodells zu bewerten, indem Residuen definiert und die Residuendiagramme untersucht werden.

Restwert

Rest ($ e $) bezieht sich auf die Differenz zwischen dem beobachteten Wert ($ y $) und dem vorhergesagten Wert ($ \ hat y $). Jeder Datenpunkt hat einen Rest.

$ {residual = observierterWert - vorhergesagterWert \\ [7pt] e = y - \ hat y} $

Restgrundstück

Ein Residuendiagramm ist ein Diagramm, in dem sich Residuen auf der vertikalen Achse und die unabhängige Variable auf der horizontalen Achse befinden. Wenn die Punkte zufällig um die horizontale Achse verteilt sind, ist ein lineares Regressionsmodell für die Daten geeignet. Andernfalls wählen Sie ein nicht lineares Modell.

Arten von Restflächen

Das folgende Beispiel zeigt nur wenige Muster in Residuendiagrammen.

Restgrundstücke

Im ersten Fall werden Punkte zufällig verteilt. Daher wird ein lineares Regressionsmodell bevorzugt. Im zweiten und dritten Fall sind die Punkte nicht zufällig verteilt und legen nahe, dass ein nicht lineares Regressionsverfahren bevorzugt wird.

Beispiel

Problemstellung:

Prüfen Sie, wo ein lineares Regressionsmodell für die folgenden Daten geeignet ist.

$ x $ 60 70 80 85 95
$ y $ (tatsächlicher Wert) 70 65 70 95 85
$ \ hat y $ (vorhergesagter Wert) 65.411 71.849 78,288 81,507 87,945

Lösung:

Schritt 1: Berechnen Sie die Residuen für jeden Datenpunkt.

$ x $ 60 70 80 85 95
$ y $ (tatsächlicher Wert) 70 65 70 95 85
$ \ hat y $ (vorhergesagter Wert) 65.411 71.849 78,288 81,507 87,945
$ e $ (Rest) 4,589 -6,849 -8,288 13.493 -2.945

Schritt 2: - Zeichnen Sie das Restdiagramm.

Restgrundstück

Schritt 3: - Überprüfen Sie die Zufälligkeit der Residuen.

Hier zeigt der Residuenplot ein zufälliges Muster - Das erste Residuum ist positiv, zwei sind negativ, das vierte ist positiv und das letzte Residuum ist negativ. Das Muster ist ziemlich zufällig, was darauf hinweist, dass ein lineares Regressionsmodell für die obigen Daten geeignet ist.