Lineare Regression mit einer abhängigen Variablen, die ein Verhältnis ist

10

Ich mache lineare Regressionen, bei denen die abhängige Variable ein Verhältnis ist, das von 0,01 bis 100 reichen kann.

Ist es in Ordnung, das Protokoll der abhängigen Variablen und die Regression dazu zu nehmen? Ich stimme mit den Ergebnissen einer Studie überein, und genau das haben sie getan.

Was ist der Unterschied zwischen der Erstellung des Protokolls und der Verwendung des Verhältnisses wie es ist?

Aaron Kreider
quelle
Ich suche eine Einschätzung der Immobilienpreise. Meine unabhängige Variable ist der geschätzte Hauspreis geteilt durch den Verkaufspreis. Meine abhängigen Variablen sind verschiedene Rassenkategorien (Prozent schwarz, weiß, spanisch und asiatisch) und das mittlere Haushaltseinkommen. Ich stelle fest, dass Zensusgebiete mit einem größeren Prozentsatz von Schwarzen ein höheres Verhältnis von Bewertung zu Verkaufspreis aufweisen als andere Gebiete.
Aaron Kreider
Warum verwenden Sie keine logistische Regression? Sie können das Verhältnis definieren, da Ihre abhängige Variable viele statistische Pakete enthält.
statnoobie1
1
Die logistische Regression gilt normalerweise für Binärwerte oder Proportionen (zwischen 0 und 1). Es ist hier nicht anwendbar, da das Verhältnis 1 überschreiten kann.
Max Ghenis

Antworten:

8

Wenn Sie das Protokoll des Verhältnisses verwenden, denken Sie daran, was das ist: Ist die Verwendung dieses Werts als abhängige Variable in Ihrem Problem sinnvoll?log(ab)=log(a)log(b)

Was nun die Verwendung des Rohverhältnisses betrifft, kann dies problematisch sein. Kronmal 1993 argumentiert, dass eine Regression mit einem Verhältnis als abhängige Variable: die als ist ein Untermodell von
YZ=α0+αXX+ϵ

Y=Z1nα0+ZXαX+Z1ϵ

Y=β0+βXX+Z1nα0+ZXαX+Z1ϵ

aka ...

  • Regressieren Sie den Zähler nach den ursprünglichen unabhängigen Variablen, dem Nenner und dem Nenner mal den ursprünglichen Variablen
  • Gewichtsregression durch (inversen) Nenner

Nur in dem Fall, in dem und Null waren, wäre das ursprüngliche Regressionsmodell gültig.β0βX

Caveat - Ich bin nicht überzeugt , ich ein vollständiges Verständnis der Verhältnisse haben entweder .

Affin
quelle
Nehmen Sie ein festes Z an? Ich habe 27.000 Fälle (auch bekannt als Immobilien) und Y (Bewertungspreis) und Z (Verkaufspreis) unterscheiden sich für jeden Fall.
Aaron Kreider
Nein, Z ist eine nxn-Diagonalmatrix, wobei die Diagonalen Ihr Verkaufspreis sind. Meine Notation in der ersten Gleichung könnte verwirrend sein, da sie keine Matrixnotation verwendet. würde mit dem Rest . Z1Y=α0+αXX+ϵ
Affine
Okay. Ich habe mir die vorgeschlagenen Ansätze in Ihrer verknüpften Frage angesehen und sie sind sinnvoll. Ich weiß nicht genug darüber, um sie tatsächlich auf die eine oder andere Weise zu empfehlen, aber wenn jemand Ihre Vorschläge bestätigt, könnte ich sie ausprobieren.
Aaron Kreider