Das Bestimmtheitsmaß wurde bereits bei der Methode der kleinsten Quadrate erwähnt und steht auch in Relation zu dieser Methode.

Zur Erinnerung: bei der Methode der kleinsten Quadrate wurde in dem Beispiel, welches genannt wurde, ein linearer Zusammenhang zwischen der abhängigen Variablen, welches in diesem Fall die Schuhgröße Y war und der unabhängigen Variablen, der Körpergröße x gebildet. Dies war an Hand der Regressionsfunktion yi = 34 + 0,05 × xi möglich.

Die Frage, welche sich nun aufdrängt ist jene, ob die Regressionsgerade gut ist. Gut bedeutet in diesem Fall, wie nah die Werte, welche sich aus der Regressionsfunktion für die Schuhgröße in Abhängigkeit von der Körpergröße ergeben haben, an den Werten der tatsächlich gemessenen Schuhgrößen liegen.

Die Antwort auf diese Frage gibt das Bestimmtheitsmaß als „Gütemaß der Regression“.
Um die Antwort geben zu können, muss die Streuung der Regressionsfunktion zu der gesamten Streuung in Relation gesetzt werden.

Ein Beispiel

Um das Bestimmtheitsmaß berechnen zu können, muss in dem ersten Schritt die Gesamtstreuung berechnet werden. Das Beispiel basiert dabei auf dem der Methode der kleinsten Quadrate.

Dabei sind die quadrierten Abstände zwischen den tatsächlichen Schuhgrößen und deren Mittelwert: (42 + 44 + 43) / 3 = 43) in der Summe: (42 – 43)2 + (44 – 43)2 + (43 – 43)2 = -12 + 12 + 02 = 1 + 1 + 0 = 2.

Im zweiten Schritt muss die, durch Regression erklärte Streuung, berechnet werden, wofür die Regressionsfunktion verwendet wird. Die Werte der Y Achse für die Schuhgrößen sind dementsprechend folgende:

y1 = 34 + 0,05 × 170 = 34 + 8,5 = 42,5
y2 = 34 + 0,05 × 180 = 34 + 9 = 43
y3 = 34 + 0,05 × 190 = 34 + 9,5 = 43,5

Anschließend muss der jeweilige Abstand zwischen den prognostizierten Schuhgrößen und dem Mittelwert quadriert und anschließend summiert werden, wobei das Ergebnis (42,5 – 43)2 + (43 – 43)2 + (43,5 – 43)2 = -0,52 + 02 + 0,52 = 0,25 + 0 + 0,25 = 0,5 rauskommt.

In dem dritten Schritt wird anschließend das Bestimmtheitsmaß berechnet. Dazu muss man wissen, dass das Bestimmheitsmaß gleich der erklärten Streuung ist und dies durch die gesamte Streuung geteilt werden muss, wobei der Wert 0,5 / 2 = 0,25 als Ergebnis vorliegt.

Das Intervall

Das Intervall, in welchem das Bestimmtheitsmaß liegt ist klar von 0 bis 1 definiert. Eins bedeutet dabei eine perfekte Regressionsgeraden.

Das bedeutet für das Beispiel, dass die Geraden mit dem Bestimmtheitsmaß von 0,25 nicht besonders gut passt.

Liegt eine lineare Regression vor, dann heißt das für das Bestimmtheitsmaß, dass dieses dem quadrierten Korrelationskoeffizienten nach Pearson entspricht. In diesem Fall wäre der Wert 0,5. Wird dieser quadriert, dann resultiert auch hier das Bestimmtheitsmaß R2 = 0,52 = 0,25.

War dieser Artikel hilfreich?
JaNein

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here