Die Wikipedia-Seite auf R2 sagt, dass einen Wert größer als 1 annehmen kann. Ich sehe nicht, wie dies möglich ist.
Werte von außerhalb des Bereichs 0 bis 1 können auftreten, wenn sie zur Messung der Übereinstimmung zwischen beobachteten und modellierten Werten verwendet werden und wenn die "modellierten" Werte nicht durch lineare Regression erhalten werden und abhängig davon, welche Formulierung von R 2 verwendet wird. Wenn die erste Formel oben verwendet wird, können die Werte kleiner als Null sein. Wenn der zweite Ausdruck verwendet wird, können die Werte größer als eins sein.
Dieses Zitat bezieht sich auf den "zweiten Ausdruck", aber ich sehe keinen zweiten Ausdruck auf der Seite.
Gibt es ein Szenario, in dem größer als 1 sein kann? Ich denke über diese Frage für die nichtlineare Regression nach, möchte aber eine allgemeine Antwort erhalten.
[Für jemanden, der diese Seite mit der entgegengesetzten Frage betrachtet: Ja; kann negativ sein. Dies geschieht, wenn Sie ein Modell anpassen, das schlechter zu den Daten passt als eine horizontale Linie. Dies ist normalerweise auf einen Fehler bei der Auswahl eines Modells oder von Einschränkungen zurückzuführen.]
quelle
Antworten:
Ich habe die Antwort gefunden und werde die Antwort auf meine Frage veröffentlichen. Wie Martijn betonte, können Sie mit linearer Regression durch zwei äquivalente Ausdrücke berechnen :R.2
Bei der nichtlinearen Regression können Sie die Quadratsumme der Residuen und die Quadratsumme der Regression nicht summieren, um die Gesamtsumme der Quadrate zu erhalten. Diese Gleichung ist einfach nicht wahr. Die obige Gleichung ist also nicht richtig. Diese beiden Experimente berechnen zwei unterschiedliche Werte für .R.2
Die einzige Gleichung, die Sinn macht und (glaube ich) universell verwendet wird, ist:
Sein Wert ist niemals größer als 1,0, aber er kann negativ sein, wenn Sie das falsche Modell (oder falsche Einschränkungen) anpassen, sodass (Quadratsumme der Residuen) größer als S S t (Quadratsumme der Differenz zwischen tatsächlichen und mittleren Y-Werten).S.S.e S.S.t
Die andere Gleichung wird bei nichtlinearer Regression nicht verwendet:
quelle
quelle