Was sind die Annahmen für die Anwendung eines Tobit-Regressionsmodells?

9

Mein (sehr grundlegendes) Wissen über das Tobit-Regressionsmodell stammt nicht aus einer Klasse, wie ich es vorziehen würde. Stattdessen habe ich hier und da durch mehrere Internetsuchen Informationen aufgenommen. Ich gehe davon aus, dass die Annahmen für eine verkürzte Regression den gewöhnlichen Annahmen der kleinsten Quadrate (OLS) sehr ähnlich sind. Ich habe jedoch keine Ahnung, ob das richtig ist.

Daher meine Frage: Auf welche Annahmen sollte ich bei der Durchführung der Tobit-Regression achten?

Hinweis: Die ursprüngliche Form dieser Frage bezog sich auf eine verkürzte Regression, die nicht das Modell war, das ich verwendet oder nach dem ich gefragt habe. Ich habe die Frage korrigiert.

Feuerfeder
quelle
1
Sie sollten keine abgeschnittene Regression verwenden, nur weil Sie Daten verzerrt oder begrenzt haben. Dies gilt insbesondere für Situationen, in denen Werte unterhalb eines Schwellenwerts (z. B. negative Werte) möglich sind, jedoch aus irgendeinem Grund nicht eingehalten werden. Ist das die Situation, die Sie haben?
Aniko
P(Y=0)>0Y
Riesiger Fehler; Mir wurde klar, dass ich die ganze Zeit Tobit- Regression meinte , nicht verkürzte Regression. Ich habe gerade die Frage geändert, um diesen Fehler widerzuspiegeln.
Feuerfeder
Die Wooldridge-Referenz ist immer noch die richtige Referenz. dh es bezieht sich auf die Tobit-Regression.
Feuerfeder
Aniko hat recht, dass tobit möglicherweise nicht die beste Wahl ist. Schauen Sie sich Folgendes an, um mehr über Alternativen zu erfahren: ideas.repec.org/p/boc/bost10/2.html

Antworten:

6

Wenn wir uns für eine einfache Antwort entscheiden, ist der Auszug aus dem Wooldridge-Buch (Seite 533) sehr angemessen:

β^βyxy|xNormal(xβ,σ2)y=yβE(u|x)=0E(xu)=0

Die Notationen in diesem Auszug stammen aus dem Tobit-Modell:

y=xβ+u,u|xN(0,σ2)y=max(y,0)
yx

Die Differenz zwischen den kleinsten Quadraten und der Tobit-Regression zusammenzufassen, ist die inhärente Annahme der Normalität in letzterer.

Ich fand auch immer, dass der ursprüngliche Artikel von Amemyia sehr gut darin war, die theoretischen Grundlagen der Tobit-Regression darzulegen .

mpiktas
quelle
Beeindruckend! Vielen Dank, dass Sie eine sichtbare Referenz gefunden haben. Ich hatte nicht daran gedacht, in Google Books nachzuschauen, wenn ich nach einer Kopie von Wooldridges Buch gesucht habe.
Feuerfeder
4

Um Anikos Kommentar zu wiederholen: Die Hauptannahme ist die Existenz von Kürzungen. Dies ist nicht die gleiche Annahme wie die beiden anderen Möglichkeiten, die mir Ihr Beitrag vorschlägt: Begrenztheit und Stichprobenauswahl.

Wenn Sie eine grundlegend begrenzte abhängige Variable anstelle einer abgeschnittenen haben, möchten Sie möglicherweise zu einem verallgemeinerten linearen Modellrahmen mit einer der (weniger häufig gewählten) Verteilungen für Y wechseln, z. B. logarithmisch normal, gamma, exponentiell usw., die dies berücksichtigen Untergrenze.

Alternativ könnten Sie sich dann fragen, ob Sie der Meinung sind, dass der Prozess, der die Nullbeobachtungen in Ihrem Modell generiert, der gleiche ist wie der, der die streng positiven Werte generiert - Preise in Ihrer Anwendung, denke ich. Ist dies nicht der Fall, ist möglicherweise etwas aus der Klasse der Stichprobenauswahlmodelle (z. B. Heckman-Modelle) geeignet. In diesem Fall wären Sie in der Lage, ein Modell für die Bereitschaft, überhaupt einen Preis zu zahlen, und ein anderes Modell für den Preis anzugeben, den Ihre Probanden zahlen würden, wenn sie etwas zahlen möchten.

Kurz gesagt, Sie möchten wahrscheinlich den Unterschied zwischen der Annahme von abgeschnittenen, zensierten, begrenzten und ausgewählten ausgewählten abhängigen Variablen überprüfen. Welches Sie möchten, hängt von den Details Ihrer Bewerbung ab. Sobald diese erste wichtige Annahme getroffen wurde, können Sie leichter feststellen, ob Ihnen die spezifischen Annahmen eines Modells in der von Ihnen gewählten Klasse gefallen. Einige der Stichprobenauswahlmodelle haben Annahmen, die ziemlich schwer zu überprüfen sind ...

Konjugatprior
quelle
3

@Firefeather: Enthalten Ihre Daten nur positive Werte (und können sie wirklich immer nur enthalten)? Wenn ja, modellieren Sie es mit einem verallgemeinerten linearen Modell mit Gammafehler und Protokollverknüpfung. Wenn es Nullen enthält, können Sie eine zweistufige (logistische Regression für die Wahrscheinlichkeit von Null und Gamma-Regression für die positiven Werte) in Betracht ziehen. Dieses letztere Szenario kann auch als einzelne Regression unter Verwendung eines aufgeblasenen Gammas von Null modelliert werden. Einige großartige Erklärungen hierfür wurden vor einigen Jahren auf einer SAS-Liste gegeben. Beginnen Sie hier, wenn Sie interessiert sind, und suchen Sie nach Folgemaßnahmen. Link Text

Könnte Ihnen helfen, in eine andere Richtung zu weisen, wenn sich die abgeschnittene Regression als unplausibel herausstellt.

B_Miner
quelle
2

Wie andere hier erwähnt haben, besteht die Hauptanwendung der Tobit-Regression darin, Daten zu zensieren. Tobit wird häufig in Verbindung mit Data Envelopment Analysis (DEA) und vom Wirtschaftswissenschaftler verwendet. In DEA liegt der Effizienzwert zwischen 0 und 1, was bedeutet, dass die abhängige Variable bei 0 von links und 1 von rechts zensiert wird. Daher ist eine Anwendung der linearen Regression (OLS) nicht möglich.

Tobit ist eine Kombination aus Probit und verkürzter Regression. Bei der Unterscheidung zwischen Zensur und Abschneiden ist Vorsicht geboten:

  • Zensur: Wenn die Grenzwertbeobachtungen in der Stichprobe enthalten sind. Die abhängigen Variablenwerte stoßen entweder links oder rechts an eine Grenze.
  • Kürzung: Beobachtung, bei der bestimmte abhängige Werte nicht in die Studie einbezogen werden. Zum Beispiel nur positive Werte. Das Abschneiden hat einen größeren Informationsverlust als das Zensieren.

Tobit = Probit + Kürzungsregression

Das Tobit-Modell nimmt wie das Probit-Modell Normalität an.

Schritte:

  1. Das Probit-Modell entscheidet, ob die abhängige Variable 0 oder 1 ist. Wenn die abhängige Variable 1 ist, um wie viel (unter der Annahme einer Zensur bei 0) .

    (Discreet decision)P(y>0)=Φ(xβ)
  2. (Continuous decision)E(yy>0)=xβ+σλ(xβσ)

Der Koeffizient ist für beide Entscheidungsmodelle gleich. ist der Korrekturterm zum Anpassen der zensierten Werte (Nullen). βσλ(xβσ)

Bitte überprüfen Sie auch das Cragg-Modell, in dem Sie in jedem Schritt ein anderes können.β

Amar Nayak
quelle
Willkommen auf der Website @Amarnayak. Ich habe Ihren Beitrag so bearbeitet, dass er die Formatierung vom Typ . Bitte stellen Sie sicher, dass immer noch angezeigt wird, was Sie möchten. LATEX
Gung - Reinstate Monica