Ich denke an ein Modell, das ein Verhältnis vorhersagt , wobei a ≤ b und a > 0 und b > 0 . Das Verhältnis würde also zwischen 0 und 1 liegen .
Ich könnte lineare Regression verwenden, obwohl sie natürlich nicht auf 0..1 beschränkt ist. Ich habe keinen Grund zu der Annahme, dass die Beziehung linear ist, aber natürlich wird sie sowieso oft als einfaches erstes Modell verwendet.
Ich könnte eine logistische Regression verwenden, obwohl sie normalerweise verwendet wird, um die Wahrscheinlichkeit eines Zweizustands-Ergebnisses vorherzusagen, und nicht, um einen kontinuierlichen Wert aus dem Bereich 0..1 vorherzusagen.
Wenn Sie nichts mehr wissen, würden Sie die lineare Regression, die logistische Regression oder die versteckte Option c verwenden ?
Antworten:
Sie sollten "versteckte Option c" wählen, wobei c die Beta-Regression ist. Dies ist ein Regressionsmodelltyp, der geeignet ist, wenn die Antwortvariable als Beta verteilt wird . Sie können es sich analog zu einem verallgemeinerten linearen Modell vorstellen . Es ist genau das, wonach Sie suchen. Es gibt ein Paket mit dem
R
Namen betareg, das sich damit befasst. Ich weiß nicht, ob Sie es verwendenR
, aber selbst wenn Sie die "Vignetten" nicht lesen können, erhalten Sie allgemeine Informationen zu diesem Thema und erfahren , wie Sie es implementierenR
(was Sie nicht benötigen) dieser Fall).Eine andere Möglichkeit ist die Verwendung der linearen Regression, wenn die Verhältnisse so transformiert werden können, dass sie den Annahmen eines linearen Standardmodells entsprechen, obwohl ich hinsichtlich der tatsächlichen Funktionsweise nicht optimistisch wäre.
quelle
Handelt es sich um gepaarte Proben oder um zwei unabhängige Populationen?
Ihr Abfang dieser Regression ist log (B) und Ihre Steigung ist log (Verhältnis).
Sehen Sie mehr hier:
Beyene J, Moineddin R. Methoden zur Konfidenzintervallschätzung eines Verhältnisparameters mit Anwendung auf Ortsquotienten. BMC medizinische Forschungsmethodik. 2005; 5 (1): 32.
EDIT: Ich habe ein SPSS-Addon geschrieben, um genau dies zu tun. Ich kann es teilen, wenn Sie interessiert sind.
quelle
REGRESSION
nach der Protokolltransformation der Daten verwendet. Seitdem habe ich eine anspruchsvollere Version geschrieben, die verwendetGLM
. Ich beschäftige mich mit Lichtemissionsmessungen und meine Tests schlugen vor, dass die Gamma-Regression mit einer logarithmischen Verknüpfung die geringste Gefahr darstellte, die Parameter zu beeinflussen. Für die meisten meiner realen Daten waren die Antworten aus der Verwendung von Normal, Negativ-Binomial und Gamma mit Log-Link alle sehr ähnlich (zumindest mit der Präzision, die ich brauchte)quelle