Was ist gemeint, wenn wir sagen, wir haben ein gesättigtes Modell?
modeling
regression
Graham Cookson
quelle
quelle
Ein gesättigtes Modell ist ein Modell, das bis zu dem Punkt überparametrisiert ist, dass es im Grunde nur die Daten interpoliert. Bei einigen Einstellungen, wie Bildkomprimierung und -rekonstruktion, ist dies nicht unbedingt eine schlechte Sache, aber wenn Sie versuchen, ein Vorhersagemodell zu erstellen, ist dies sehr problematisch.
Kurz gesagt, gesättigte Modelle führen zu Prädiktoren mit extrem hoher Varianz, die mehr vom Rauschen als von den tatsächlichen Daten beeinflusst werden.
Stellen Sie sich als Gedankenexperiment vor, Sie haben ein gesättigtes Modell und die Daten enthalten Rauschen. Stellen Sie sich dann vor, Sie passen das Modell einige hundert Mal an, jedes Mal mit einer anderen Rauschrealisierung, und sagen dann einen neuen Punkt voraus. Es ist wahrscheinlich, dass Sie jedes Mal radikal unterschiedliche Ergebnisse erhalten, sowohl für Ihre Anpassung als auch für Ihre Vorhersage (und in dieser Hinsicht sind Polynommodelle besonders ungeheuerlich). Mit anderen Worten, die Varianz der Anpassung und des Prädiktors sind extrem hoch.
Im Gegensatz dazu ergibt ein Modell, das nicht gesättigt ist, (wenn es vernünftig konstruiert ist) Anpassungen, die selbst bei unterschiedlicher Rauschrealisierung konsistenter sind, und die Varianz des Prädiktors wird ebenfalls verringert.
quelle
Ein Modell ist genau dann gesättigt, wenn es so viele Parameter wie Datenpunkte (Beobachtungen) hat. Oder anders ausgedrückt, bei nicht gesättigten Modellen sind die Freiheitsgrade größer als Null.
Dies bedeutet im Grunde, dass dieses Modell nutzlos ist, da es die Daten nicht sparsamer beschreibt als die Rohdaten (und Daten sparsamer zu beschreiben ist im Allgemeinen die Idee, die hinter der Verwendung eines Modells steht). Darüber hinaus können gesättigte Modelle eine (unbrauchbare) perfekte Anpassung liefern (müssen dies aber nicht), da sie nur die Daten interpolieren oder iterieren.
Nehmen Sie zum Beispiel den Mittelwert als Modell für einige Daten. Wenn Sie nur einen Datenpunkt (z. B. 5) haben, hilft die Verwendung des Mittelwerts (dh 5; beachten Sie, dass der Mittelwert ein gesättigtes Modell für nur einen Datenpunkt ist) überhaupt nicht. Wenn Sie jedoch bereits zwei Datenpunkte (z. B. 5 und 7) haben und den Mittelwert (z. B. 6) als Modell verwenden, erhalten Sie eine genauere Beschreibung als die Originaldaten.
quelle
Wie alle anderen bereits gesagt haben, bedeutet dies, dass Sie so viele Parameter haben, wie Sie Datenpunkte haben. Also, keine Passungstests. Dies bedeutet jedoch nicht, dass das Modell "per Definition" perfekt zu jedem Datenpunkt passen kann. Ich kann Ihnen anhand persönlicher Erfahrungen erzählen, wie Sie mit einigen gesättigten Modellen gearbeitet haben, die bestimmte Datenpunkte nicht vorhersagen konnten. Es ist ziemlich selten, aber möglich.
Ein weiteres wichtiges Thema ist, dass gesättigt nicht nutzlos bedeutet. Beispielsweise werden in mathematischen Modellen der menschlichen Kognition Modellparameter bestimmten kognitiven Prozessen zugeordnet, die einen theoretischen Hintergrund haben. Wenn ein Modell gesättigt ist, können Sie seine Angemessenheit testen, indem Sie gezielte Experimente mit Manipulationen durchführen, die sich nur auf bestimmte Parameter auswirken sollten. Wenn die theoretischen Vorhersagen mit den beobachteten Unterschieden (oder dem Fehlen) der Parameterschätzungen übereinstimmen, kann man sagen, dass das Modell gültig ist.
Ein Beispiel: Stellen Sie sich zum Beispiel ein Modell vor, das zwei Parametersätze enthält, einen für die kognitive Verarbeitung und einen für die motorischen Reaktionen. Stellen Sie sich vor, Sie haben ein Experiment mit zwei Bedingungen, bei denen die Reaktionsfähigkeit der Teilnehmer beeinträchtigt ist (sie können nur eine Hand anstelle von zwei verwenden), und bei der anderen Bedingung liegt keine Beeinträchtigung vor. Wenn das Modell gültig ist, sollten Unterschiede in den Parameterschätzungen für beide Bedingungen nur für die Motorantwortparameter auftreten.
Beachten Sie auch, dass ein Modell, auch wenn es nicht gesättigt ist, möglicherweise immer noch nicht identifizierbar ist. Dies bedeutet, dass verschiedene Kombinationen von Parameterwerten dasselbe Ergebnis erzielen, wodurch die Modellanpassung beeinträchtigt wird.
Wenn Sie allgemein weitere Informationen zu diesen Themen erhalten möchten, lesen Sie möglicherweise die folgenden Artikel:
Bamber, D. & van Santen, JPH (1985). Wie viele Parameter kann ein Modell haben und noch testbar sein? Journal of Mathematical Psychology, 29, 443-473.
Bamber, D. & van Santen, JPH (2000). Wie bewertet man die Testbarkeit und Identifizierbarkeit eines Modells? Journal of Mathematical Psychology, 44, 20-40.
Prost
quelle
Dies ist auch nützlich, wenn Sie den AIC für ein Quasi-Likelihood-Modell berechnen müssen. Die Schätzung der Dispersion sollte aus dem gesättigten Modell stammen. Sie würden den LL, den Sie anpassen, durch die geschätzte Streuung vom gesättigten Modell in der AIC-Berechnung dividieren.
quelle
Im Kontext von SEM (oder Pfadanalyse) ist ein gesättigtes Modell oder ein gerade identifiziertes Modell ein Modell, bei dem die Anzahl der freien Parameter genau der Anzahl der Varianzen und eindeutigen Kovarianzen entspricht. Das folgende Modell ist beispielsweise ein gesättigtes Modell, da 3 * 4/2 Datenpunkte (Varianzen und eindeutige Kovarianzen) sowie 6 freie Parameter zu schätzen sind:
quelle