Mein (sehr grundlegendes) Wissen über das Tobit-Regressionsmodell stammt nicht aus einer Klasse, wie ich es vorziehen würde. Stattdessen habe ich hier und da durch mehrere Internetsuchen Informationen aufgenommen. Ich gehe davon aus, dass die Annahmen für eine verkürzte Regression den gewöhnlichen Annahmen der kleinsten Quadrate (OLS) sehr ähnlich sind. Ich habe jedoch keine Ahnung, ob das richtig ist.
Daher meine Frage: Auf welche Annahmen sollte ich bei der Durchführung der Tobit-Regression achten?
Hinweis: Die ursprüngliche Form dieser Frage bezog sich auf eine verkürzte Regression, die nicht das Modell war, das ich verwendet oder nach dem ich gefragt habe. Ich habe die Frage korrigiert.
regression
assumptions
Feuerfeder
quelle
quelle
Antworten:
Wenn wir uns für eine einfache Antwort entscheiden, ist der Auszug aus dem Wooldridge-Buch (Seite 533) sehr angemessen:
Die Notationen in diesem Auszug stammen aus dem Tobit-Modell:
Die Differenz zwischen den kleinsten Quadraten und der Tobit-Regression zusammenzufassen, ist die inhärente Annahme der Normalität in letzterer.
Ich fand auch immer, dass der ursprüngliche Artikel von Amemyia sehr gut darin war, die theoretischen Grundlagen der Tobit-Regression darzulegen .
quelle
Um Anikos Kommentar zu wiederholen: Die Hauptannahme ist die Existenz von Kürzungen. Dies ist nicht die gleiche Annahme wie die beiden anderen Möglichkeiten, die mir Ihr Beitrag vorschlägt: Begrenztheit und Stichprobenauswahl.
Wenn Sie eine grundlegend begrenzte abhängige Variable anstelle einer abgeschnittenen haben, möchten Sie möglicherweise zu einem verallgemeinerten linearen Modellrahmen mit einer der (weniger häufig gewählten) Verteilungen für Y wechseln, z. B. logarithmisch normal, gamma, exponentiell usw., die dies berücksichtigen Untergrenze.
Alternativ könnten Sie sich dann fragen, ob Sie der Meinung sind, dass der Prozess, der die Nullbeobachtungen in Ihrem Modell generiert, der gleiche ist wie der, der die streng positiven Werte generiert - Preise in Ihrer Anwendung, denke ich. Ist dies nicht der Fall, ist möglicherweise etwas aus der Klasse der Stichprobenauswahlmodelle (z. B. Heckman-Modelle) geeignet. In diesem Fall wären Sie in der Lage, ein Modell für die Bereitschaft, überhaupt einen Preis zu zahlen, und ein anderes Modell für den Preis anzugeben, den Ihre Probanden zahlen würden, wenn sie etwas zahlen möchten.
Kurz gesagt, Sie möchten wahrscheinlich den Unterschied zwischen der Annahme von abgeschnittenen, zensierten, begrenzten und ausgewählten ausgewählten abhängigen Variablen überprüfen. Welches Sie möchten, hängt von den Details Ihrer Bewerbung ab. Sobald diese erste wichtige Annahme getroffen wurde, können Sie leichter feststellen, ob Ihnen die spezifischen Annahmen eines Modells in der von Ihnen gewählten Klasse gefallen. Einige der Stichprobenauswahlmodelle haben Annahmen, die ziemlich schwer zu überprüfen sind ...
quelle
@Firefeather: Enthalten Ihre Daten nur positive Werte (und können sie wirklich immer nur enthalten)? Wenn ja, modellieren Sie es mit einem verallgemeinerten linearen Modell mit Gammafehler und Protokollverknüpfung. Wenn es Nullen enthält, können Sie eine zweistufige (logistische Regression für die Wahrscheinlichkeit von Null und Gamma-Regression für die positiven Werte) in Betracht ziehen. Dieses letztere Szenario kann auch als einzelne Regression unter Verwendung eines aufgeblasenen Gammas von Null modelliert werden. Einige großartige Erklärungen hierfür wurden vor einigen Jahren auf einer SAS-Liste gegeben. Beginnen Sie hier, wenn Sie interessiert sind, und suchen Sie nach Folgemaßnahmen. Link Text
Könnte Ihnen helfen, in eine andere Richtung zu weisen, wenn sich die abgeschnittene Regression als unplausibel herausstellt.
quelle
Wie andere hier erwähnt haben, besteht die Hauptanwendung der Tobit-Regression darin, Daten zu zensieren. Tobit wird häufig in Verbindung mit Data Envelopment Analysis (DEA) und vom Wirtschaftswissenschaftler verwendet. In DEA liegt der Effizienzwert zwischen 0 und 1, was bedeutet, dass die abhängige Variable bei 0 von links und 1 von rechts zensiert wird. Daher ist eine Anwendung der linearen Regression (OLS) nicht möglich.
Tobit ist eine Kombination aus Probit und verkürzter Regression. Bei der Unterscheidung zwischen Zensur und Abschneiden ist Vorsicht geboten:
Tobit = Probit + Kürzungsregression
Das Tobit-Modell nimmt wie das Probit-Modell Normalität an.
Schritte:
Das Probit-Modell entscheidet, ob die abhängige Variable 0 oder 1 ist. Wenn die abhängige Variable 1 ist, um wie viel (unter der Annahme einer Zensur bei 0) .
Der Koeffizient ist für beide Entscheidungsmodelle gleich. ist der Korrekturterm zum Anpassen der zensierten Werte (Nullen).β σλ(x′βσ)
Bitte überprüfen Sie auch das Cragg-Modell, in dem Sie in jedem Schritt ein anderes können.β
quelle