Nehmen wir und und nehmen wir an, wir modellieren die Aufgabe der Vorhersage von y mit gegebenem x unter Verwendung der logistischen Regression. Wann können logistische Regressionskoeffizienten in geschlossener Form geschrieben werden?
Ein Beispiel ist, wenn wir ein gesättigtes Modell verwenden.
Das heißt, definiert , , wobei Indizes Sätze in dem Leistungssatz , und liefern 1 wenn alle Variablen in der -ten Menge 1 und sonst 0 sind. Dann können Sie jedes in diesem logistischen Regressionsmodell als Logarithmus einer rationalen Funktion der Statistik der Daten ausdrücken .
Gibt es noch andere interessante Beispiele, wenn geschlossene Form existiert?
logistic
generalized-linear-model
Jaroslaw Bulatow
quelle
quelle
Antworten:
Wie kjetil b halvorsen ausführte, ist es auf seine Weise ein Wunder, dass die lineare Regression eine analytische Lösung zulässt. Und das nur aufgrund der Linearität des Problems (in Bezug auf die Parameter). In OLS haben Sie was die Bedingungen erster Ordnung hat - 2 ∑ i ( y i - x ' i β ) x i = 0 Für ein Problem mit p
Mit der logistischen Regression ist es nicht mehr so einfach. Schreiben Sie die log-Likelihood-Funktion auf, und wenn wir die Ableitung nehmen, um die MLE zu finden, erhalten wir ∂ l
Ein etwas tieferer Blick auf das Problem (unter Verwendung der zweiten Ableitung) zeigt, dass es sich um ein konvexes Optimierungsproblem handelt, bei dem ein Maximum einer konkaven Funktion (eine verherrlichte multivariate Parabel) gefunden wird. Es gibt also eine von beiden, und jeder sinnvolle Algorithmus sollte dies eher finden schnell, oder die Dinge sprengen ins Unendliche. Letzteres tut zufällig logistische Regression , wenn für einige cProb[Yi=1|x′iβ>c]=1 c Sie haben also eine perfekte Vorhersage. Dies ist ein ziemlich unangenehmes Artefakt: Sie würden denken, wenn Sie eine perfekte Vorhersage haben, funktioniert das Modell perfekt, aber seltsamerweise ist es umgekehrt.
quelle
Dieser Beitrag war ursprünglich als langer Kommentar gedacht und nicht als vollständige Antwort auf die vorliegende Frage.
Aus der Frage ist es ein wenig unklar, ob das Interesse nur im binären Fall liegt oder vielleicht in allgemeineren Fällen, in denen sie stetig sind oder andere diskrete Werte annehmen.
Ein Beispiel, das die Frage nicht ganz beantwortet, aber verwandt ist und das mir gefällt, befasst sich mit Rangfolgen der Artikelpräferenzen, die durch paarweise Vergleiche erhalten wurden. Das Bradley-Terry-Modell kann als logistische Regression ausgedrückt werden
If a full round-robin of comparisons is performed (i.e., a pairwise preference is recorded for each unordered(i,j) pair), then it turns out that the rank order of the MLEs α^i entsprechen der Rangfolge von Sich= ∑j ≠ iY.ichj , die Summe der Male, die jedes Objekt einem anderen vorgezogen wurde.
Um dies zu interpretieren, stellen Sie sich ein komplettes Rundenturnier in Ihrem Lieblingswettkampfsport vor. Dieses Ergebnis besagt dann, dass das Bradley-Terry-Modell die Spieler / Teams nach ihrem Gewinnprozentsatz einordnet. Ob dies ein ermutigendes oder enttäuschendes Ergebnis ist, hängt wohl von Ihrer Sichtweise ab.
NB Dieses Rangordnungsergebnis gilt im Allgemeinen nicht, wenn kein vollständiges Round-Robin gespielt wird.
quelle