Ich habe gerade eine (sehr) einfache lineare Regression in Genstat durchgeführt und möchte eine kurze und aussagekräftige Zusammenfassung der Ausgabe in meinen Bericht aufnehmen. Ich bin mir nicht sicher, was oder wie viele Informationen ich aufnehmen soll.
Die Hauptbits meiner Genstat-Ausgabe sehen folgendermaßen aus:
Summary of analysis
Source d.f. s.s. m.s. v.r. F pr.
Regression 1 8128935. 8128935. 814.41 <.001
Residual 53 529015. 9981.
Total 54 8657950. 160332.
Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.
Estimates of parameters
Parameter estimate s.e. t(53) t pr.
Constant 41.5 30.7 1.35 0.182
UKHR_Ref 0.8659 0.0303 28.54 <.001
Ich wollte dies einfach so melden:
Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).
aber ein kollege hat vorgeschlagen, dass ich auch mindestens das einbeziehen sollte root mean squared error
(was meiner meinung nach in diesem fall gleich dem standardfehler der beobachtungen ist, dh 99,9?).
Bietet die Einbeziehung des RMSE zusätzliche nützliche Informationen oder wird die Anpassungsgüte bereits durch den angepassten R2-Wert angemessen erklärt?
Gibt es feste Regeln für die Anzahl der zu meldenden Informationen oder ist diese ziemlich subjektiv?
Vielen Dank!
quelle
Antworten:
Für eine einfache lineare Regression würde ich immer ein Diagramm der x-Variablen gegen die y-Variable erstellen, wobei die Regressionslinie dem Diagramm überlagert ist (zeichnen Sie Ihre Daten immer, wann immer dies möglich ist!). Dies zeigt Ihnen sehr leicht, wie gut Ihr Modell passt, und ist für 1 variable Regression leicht zu lesen. Das Hinzufügen zu dem, was Sie bereits haben, würde wahrscheinlich ausreichen, obwohl Sie möglicherweise einige diagnostische Diagramme (Hebelwirkung, Kochentfernung, Residuen usw.) einbeziehen möchten. Dies hängt davon ab, wie gut diese xy-Handlung ist, von Ihrer Zielgruppe und von den Protokollen, die Ihre Zielgruppe erwartet.
quelle
Ich benutze, um den β-Koeffizienten plus den 95% CI, den p-Wert und das angepasste Rsquared zu melden. Ex:
Wenn ich eine multiple Regression oder eine Regression mit Faktorvariablen berichte, gebe ich den Koeffizienten, den 95% CI, die p-Werte und dann getrennt die F-Statistiken (Freiheitsgrade), das angepasste R2 und den p-Wert des Modells an.
quelle