Berichtsergebnisse einer einfachen linearen Regression: Welche Informationen müssen einbezogen werden?

10

Ich habe gerade eine (sehr) einfache lineare Regression in Genstat durchgeführt und möchte eine kurze und aussagekräftige Zusammenfassung der Ausgabe in meinen Bericht aufnehmen. Ich bin mir nicht sicher, was oder wie viele Informationen ich aufnehmen soll.

Die Hauptbits meiner Genstat-Ausgabe sehen folgendermaßen aus:

Summary of analysis 
Source      d.f.    s.s.       m.s.       v.r.    F pr.
Regression    1   8128935.   8128935.    814.41   <.001
Residual     53    529015.      9981.        
Total        54   8657950.    160332.        

Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.

Estimates of parameters 
Parameter    estimate    s.e.     t(53)   t pr.
Constant      41.5      30.7       1.35   0.182
UKHR_Ref       0.8659    0.0303   28.54   <.001

Ich wollte dies einfach so melden:

Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).

aber ein kollege hat vorgeschlagen, dass ich auch mindestens das einbeziehen sollte root mean squared error(was meiner meinung nach in diesem fall gleich dem standardfehler der beobachtungen ist, dh 99,9?).

Bietet die Einbeziehung des RMSE zusätzliche nützliche Informationen oder wird die Anpassungsgüte bereits durch den angepassten R2-Wert angemessen erklärt?

Gibt es feste Regeln für die Anzahl der zu meldenden Informationen oder ist diese ziemlich subjektiv?

Vielen Dank!

JamesS
quelle
1
"Gibt es feste Regeln für die Anzahl der zu meldenden Informationen?" - Das hängt wirklich davon ab, was Sie nach der Regression tun möchten. Man könnte nur mit dem Korrelationskoeffizienten zufrieden sein; Man könnte den Durbin-Watson-Wert darüber hinaus brauchen, und noch ein anderer möchte vielleicht die Diagonale der Hutmatrix sehen ... es kommt wirklich darauf an.
JM ist kein Statistiker
2
Einige Organisationen haben Regeln. Siehe zum Beispiel die APA-Richtlinien .
whuber

Antworten:

6

Für eine einfache lineare Regression würde ich immer ein Diagramm der x-Variablen gegen die y-Variable erstellen, wobei die Regressionslinie dem Diagramm überlagert ist (zeichnen Sie Ihre Daten immer, wann immer dies möglich ist!). Dies zeigt Ihnen sehr leicht, wie gut Ihr Modell passt, und ist für 1 variable Regression leicht zu lesen. Das Hinzufügen zu dem, was Sie bereits haben, würde wahrscheinlich ausreichen, obwohl Sie möglicherweise einige diagnostische Diagramme (Hebelwirkung, Kochentfernung, Residuen usw.) einbeziehen möchten. Dies hängt davon ab, wie gut diese xy-Handlung ist, von Ihrer Zielgruppe und von den Protokollen, die Ihre Zielgruppe erwartet.

R.2

R.2±±2R.2

Wahrscheinlichkeitslogik
quelle
Danke @probabilityislogic. Ich habe eine Handlung in meinen Bericht aufgenommen, und es klingt so, und mein ursprünglicher Satz sollte in diesem Fall ausreichen. Ich denke, dass das Einfügen von Diagnoseplots für dieses Publikum wahrscheinlich unnötig ist, obwohl ich sie offensichtlich selbst überprüft habe und sie vernünftig aussehen. Vielen Dank auch für die Erklärung von R2 vs. RMSE - es ist sehr hilfreich.
JamesS
Was ist mit den t-Werten und df (s)? Wann sollten diese aufgenommen werden? Ist es nur sinnvoll, beide oder keine einzubeziehen?
verrückt über natty
1

Ich benutze, um den β-Koeffizienten plus den 95% CI, den p-Wert und das angepasste Rsquared zu melden. Ex:

(β = 1,46, 95% CI [1,19, 1,8], p = 0,001 **, eingestelltes R2 = 0,48)

Wenn ich eine multiple Regression oder eine Regression mit Faktorvariablen berichte, gebe ich den Koeffizienten, den 95% CI, die p-Werte und dann getrennt die F-Statistiken (Freiheitsgrade), das angepasste R2 und den p-Wert des Modells an.

Bakaburg
quelle