Was ist ein "gesättigtes" Modell?

58

Was ist gemeint, wenn wir sagen, wir haben ein gesättigtes Modell?

Graham Cookson
quelle

Antworten:

36

Bei einem gesättigten Modell gibt es so viele geschätzte Parameter wie Datenpunkte. Per Definition führt dies zu einer perfekten Anpassung, ist jedoch statistisch gesehen von geringem Nutzen, da Sie keine Daten mehr zur Schätzung der Varianz haben.

Wenn Sie beispielsweise 6 Datenpunkte haben und ein Polynom 5. Ordnung an die Daten anpassen, erhalten Sie ein gesättigtes Modell (einen Parameter für jede der 5 Potenzen Ihrer unabhängigen Variablen plus einen für den konstanten Term).

James
quelle
17
Ich habe Beispiele gesehen, bei denen ein Modell zehn Datenpunkte und neun Parameter hat. Als ich darauf hinwies, dass das Modell zu viele Parameter hat, wurde mir gesagt, dass der R ^ 2-Wert 0,999 beträgt, also muss das Modell korrekt sein!
Csgillespie
4
Wie in meinem und Dave's Post zu lesen ist, führen gesättigte Modelle nicht per Definition zu einer perfekten Passform. aber wenn Sie das Polynom n-1 als Modell verwenden, werden sie. siehe Sue Doe Nihms wegweisendes Papier zu diesem Thema psych.fullerton.edu/mbirnbaum/papers/Nihm_18_1976.pdf
Henrik
24

Ein gesättigtes Modell ist ein Modell, das bis zu dem Punkt überparametrisiert ist, dass es im Grunde nur die Daten interpoliert. Bei einigen Einstellungen, wie Bildkomprimierung und -rekonstruktion, ist dies nicht unbedingt eine schlechte Sache, aber wenn Sie versuchen, ein Vorhersagemodell zu erstellen, ist dies sehr problematisch.

Kurz gesagt, gesättigte Modelle führen zu Prädiktoren mit extrem hoher Varianz, die mehr vom Rauschen als von den tatsächlichen Daten beeinflusst werden.

Stellen Sie sich als Gedankenexperiment vor, Sie haben ein gesättigtes Modell und die Daten enthalten Rauschen. Stellen Sie sich dann vor, Sie passen das Modell einige hundert Mal an, jedes Mal mit einer anderen Rauschrealisierung, und sagen dann einen neuen Punkt voraus. Es ist wahrscheinlich, dass Sie jedes Mal radikal unterschiedliche Ergebnisse erhalten, sowohl für Ihre Anpassung als auch für Ihre Vorhersage (und in dieser Hinsicht sind Polynommodelle besonders ungeheuerlich). Mit anderen Worten, die Varianz der Anpassung und des Prädiktors sind extrem hoch.

Im Gegensatz dazu ergibt ein Modell, das nicht gesättigt ist, (wenn es vernünftig konstruiert ist) Anpassungen, die selbst bei unterschiedlicher Rauschrealisierung konsistenter sind, und die Varianz des Prädiktors wird ebenfalls verringert.

Reich
quelle
17

Ein Modell ist genau dann gesättigt, wenn es so viele Parameter wie Datenpunkte (Beobachtungen) hat. Oder anders ausgedrückt, bei nicht gesättigten Modellen sind die Freiheitsgrade größer als Null.

Dies bedeutet im Grunde, dass dieses Modell nutzlos ist, da es die Daten nicht sparsamer beschreibt als die Rohdaten (und Daten sparsamer zu beschreiben ist im Allgemeinen die Idee, die hinter der Verwendung eines Modells steht). Darüber hinaus können gesättigte Modelle eine (unbrauchbare) perfekte Anpassung liefern (müssen dies aber nicht), da sie nur die Daten interpolieren oder iterieren.

Nehmen Sie zum Beispiel den Mittelwert als Modell für einige Daten. Wenn Sie nur einen Datenpunkt (z. B. 5) haben, hilft die Verwendung des Mittelwerts (dh 5; beachten Sie, dass der Mittelwert ein gesättigtes Modell für nur einen Datenpunkt ist) überhaupt nicht. Wenn Sie jedoch bereits zwei Datenpunkte (z. B. 5 und 7) haben und den Mittelwert (z. B. 6) als Modell verwenden, erhalten Sie eine genauere Beschreibung als die Originaldaten.

Henrik
quelle
8
Dieser Punkt über Sättigung, der keine perfekte Passform impliziert, ist der interessanteste Teil dieses Themas. Ein natürliches Beispiel für eine solche Situation wäre die monotone Regression . Angenommen, Sie wissen, dass Ihre Werte mit der Zeit zunehmen müssen, und Sie führen eine Polynomregression durch, wodurch die Polynome auf eine Zunahme beschränkt werden. Berücksichtigen Sie fehlerhafte Daten, sodass sie manchmal etwas abnehmen. Unabhängig davon, wie viele Parameter Sie verwenden (auch wenn es sich um mehr als die Anzahl der Datenwerte handelt), passen Sie diese Daten niemals perfekt an.
whuber
17

Wie alle anderen bereits gesagt haben, bedeutet dies, dass Sie so viele Parameter haben, wie Sie Datenpunkte haben. Also, keine Passungstests. Dies bedeutet jedoch nicht, dass das Modell "per Definition" perfekt zu jedem Datenpunkt passen kann. Ich kann Ihnen anhand persönlicher Erfahrungen erzählen, wie Sie mit einigen gesättigten Modellen gearbeitet haben, die bestimmte Datenpunkte nicht vorhersagen konnten. Es ist ziemlich selten, aber möglich.

Ein weiteres wichtiges Thema ist, dass gesättigt nicht nutzlos bedeutet. Beispielsweise werden in mathematischen Modellen der menschlichen Kognition Modellparameter bestimmten kognitiven Prozessen zugeordnet, die einen theoretischen Hintergrund haben. Wenn ein Modell gesättigt ist, können Sie seine Angemessenheit testen, indem Sie gezielte Experimente mit Manipulationen durchführen, die sich nur auf bestimmte Parameter auswirken sollten. Wenn die theoretischen Vorhersagen mit den beobachteten Unterschieden (oder dem Fehlen) der Parameterschätzungen übereinstimmen, kann man sagen, dass das Modell gültig ist.

Ein Beispiel: Stellen Sie sich zum Beispiel ein Modell vor, das zwei Parametersätze enthält, einen für die kognitive Verarbeitung und einen für die motorischen Reaktionen. Stellen Sie sich vor, Sie haben ein Experiment mit zwei Bedingungen, bei denen die Reaktionsfähigkeit der Teilnehmer beeinträchtigt ist (sie können nur eine Hand anstelle von zwei verwenden), und bei der anderen Bedingung liegt keine Beeinträchtigung vor. Wenn das Modell gültig ist, sollten Unterschiede in den Parameterschätzungen für beide Bedingungen nur für die Motorantwortparameter auftreten.

Beachten Sie auch, dass ein Modell, auch wenn es nicht gesättigt ist, möglicherweise immer noch nicht identifizierbar ist. Dies bedeutet, dass verschiedene Kombinationen von Parameterwerten dasselbe Ergebnis erzielen, wodurch die Modellanpassung beeinträchtigt wird.

Wenn Sie allgemein weitere Informationen zu diesen Themen erhalten möchten, lesen Sie möglicherweise die folgenden Artikel:

Bamber, D. & van Santen, JPH (1985). Wie viele Parameter kann ein Modell haben und noch testbar sein? Journal of Mathematical Psychology, 29, 443-473.

Bamber, D. & van Santen, JPH (2000). Wie bewertet man die Testbarkeit und Identifizierbarkeit eines Modells? Journal of Mathematical Psychology, 44, 20-40.

Prost

Dave Kellen
quelle
3

Dies ist auch nützlich, wenn Sie den AIC für ein Quasi-Likelihood-Modell berechnen müssen. Die Schätzung der Dispersion sollte aus dem gesättigten Modell stammen. Sie würden den LL, den Sie anpassen, durch die geschätzte Streuung vom gesättigten Modell in der AIC-Berechnung dividieren.

Stephen Lien
quelle
2

Im Kontext von SEM (oder Pfadanalyse) ist ein gesättigtes Modell oder ein gerade identifiziertes Modell ein Modell, bei dem die Anzahl der freien Parameter genau der Anzahl der Varianzen und eindeutigen Kovarianzen entspricht. Das folgende Modell ist beispielsweise ein gesättigtes Modell, da 3 * 4/2 Datenpunkte (Varianzen und eindeutige Kovarianzen) sowie 6 freie Parameter zu schätzen sind:

ein gesättigtes Modell

Ehsan88
quelle