Ich habe über dieses Problem nachgedacht. Die übliche logistische Funktion zum Modellieren von Binärdaten lautet: Die Funktion ist jedoch eine S-förmige Kurve , immer das Beste für die Modellierung der Daten? Vielleicht haben Sie Grund zu der Annahme, dass Ihre Daten nicht der normalen S-förmigen Kurve folgen, sondern einem anderen Kurventyp mit Bereich .(0,1)
Gibt es Forschungen dazu? Vielleicht können Sie es als Probit-Funktion oder ähnliches modellieren, aber was ist, wenn es sich um etwas ganz anderes handelt? Könnte dies zu einer besseren Abschätzung der Auswirkungen führen? Nur ein Gedanke, den ich hatte, und ich frage mich, ob es irgendwelche Untersuchungen dazu gibt.
Antworten:
Menschen verwenden alle Arten von Funktionen, um ihre Daten zwischen 0 und 1 zu halten. Die logarithmischen Gewinnchancen gehen natürlich aus der Mathematik hervor, wenn Sie das Modell ableiten (es wird als "kanonische Verknüpfungsfunktion" bezeichnet), aber Sie können völlig frei damit experimentieren andere Alternativen.
Wie Macro in seinem Kommentar zu Ihrer Frage angedeutet hat, ist eine häufige Wahl ein Probit-Modell , bei dem die Quantilfunktion eines Gaußschen anstelle der logistischen Funktion verwendet wird. Ich habe auch gute Dinge über die Verwendung der Quantilfunktion der Verteilung eines Schülers gehört , obwohl ich es nie ausprobiert habe.t
Hoffe das hilft.
Bearbeitet, um hinzuzufügen : Die Diskussion, mit der @Macro verknüpft ist, ist wirklich exzellent. Ich würde es wärmstens empfehlen, wenn Sie sich für mehr Details interessieren.
quelle
Ich sehe keinen Grund, a priori, warum die entsprechende Verknüpfungsfunktion für einen bestimmten Datensatz das Logit sein muss (obwohl das Universum uns im Allgemeinen eher freundlich erscheint). Ich weiß nicht, ob das genau das ist, wonach Sie suchen, aber hier sind einige Artikel, die exotischere Linkfunktionen behandeln:
Cauchit (etc.):
Koenker, R. & Yoon, J. (2009). Parametrische Verknüpfungen für Binärauswahlmodelle: Eine fischer-bayesianische Kolloquie . Journal of Econometrics, 152, 2 , S. 120-130.
Koenker, R. (2006). Parametrische Links für Binärauswahlmodelle . Rnews, 6, 4 , S. 32-34.
Scobit :
Nagler, J. (1994). Scobit: Ein alternativer Schätzer für Logit und Probit . American Journal of Political Science, 38, 1 , S. 230-255.
Skew-Probit :
Bazan, JL, Bolfarine, H. & Branco, MD (2010). Ein Framework für Skew-Probit-Links in der binären Regression . Kommunikationen in der Statistik - Theorie und Methoden, 39 , S. 678-697.
(Dies scheint eine gute Übersicht über verzerrte Links innerhalb eines Bayes'schen Frameworks zu sein) :
Chen, MH (2004). Verzerrte Linkmodelle für kategoriale Antwortdaten . In Skew-Elliptical Distributions und ihre Anwendungen: Eine Reise jenseits der Normalität , Marc Genton, Herausgeber. Chapman und Hall.
Offenlegung: Ich kenne dieses Material nicht gut. Ich habe vor ein paar Jahren versucht, mit Cauchit und Scobit zu experimentieren, aber mein Code stürzte immer wieder ab (wahrscheinlich, weil ich kein großartiger Programmierer bin), und es schien für das Projekt, an dem ich arbeitete, nicht relevant zu sein, also habe ich es fallen gelassen .
quelle
Die beste Strategie besteht darin, die Daten im Lichte der aktuellen Entwicklungen zu modellieren (keine Überraschung!).
Es gibt wahrscheinlich keine Forschung zu diesen Modellen als solchen, obwohl zu jedem dieser Modelle und zu den Vergleichen zwischen ihnen und zu verschiedenen Arten ihrer Schätzung reichlich Forschung betrieben wurde. Was Sie in der Literatur finden, ist, dass es für eine Weile eine Menge Aktivität gibt, da Forscher eine Reihe von Optionen für eine bestimmte Klasse von Problemen in Betracht ziehen und dann eine Methode als überlegen herauskommt.
quelle
quelle