Ein Satz Erklärung des AIC für nichttechnische Typen

8

Ich brauche eine einsatzige Erklärung der Verwendung des AIC beim Modellbau. Bisher habe ich "Einfach ausgedrückt, der AIC ist ein relatives Maß für das Ausmaß der beobachteten Variation, die von verschiedenen Modellen berücksichtigt wird, und ermöglicht eine Korrektur der Komplexität des Modells."

Jeder Rat sehr geschätzt.

R.

Rosser
quelle

Antworten:

11

AIC ist eine Zahl, die für den Vergleich von Modellen hilfreich ist, da sie sowohl misst, wie gut das Modell zu den Daten passt, als auch wie komplex das Modell ist.

Peter Flom
quelle
8

Was die beste Erklärung wäre, hängt davon ab, was genau unter "nichttechnischen Typen" zu verstehen ist. Ich mag die Aussagen, die bisher angeboten wurden, aber ich habe ein Problem: Sie neigen dazu, den Begriff "komplex" zu verwenden, und was genau das bedeutet, kann variieren. Lassen Sie mich diese Variante anbieten:

Der AIC ist ein Maß dafür, wie gut ein Modell zu einem Datensatz passt, während die Fähigkeit dieses Modells angepasst wird , zu jedem Datensatz zu passen, unabhängig davon, ob es verwandt ist oder nicht.

gung - Monica wieder einsetzen
quelle
+1. Ich glaube, das ist der Schlüssel: Wann ist mehr flexibel zu flexibel? Vielleicht könnte "Anpassen für" "Bestrafung" umformuliert werden? Also ist es so etwas wieThe AIC is a measure of how well a model fits a dataset, penalizing models that are so flexible that they would also fit unrelated datasets just as well.
Wayne
Ich bin damit einverstanden, dass es davon abhängt, was unter "nicht technischen Typen" zu verstehen ist. Die meisten Menschen, mit denen ich zusammenarbeite, sind Doktoranden in den Sozial-, Medizin- oder Verhaltenswissenschaften. Sie sind gebildet, kennen aber keine Statistiken. Aber ich bin mir nicht sicher, ob mir die letzten paar Wörter in Ihrer Definition gefallen, da unklar ist, was "verwandt" hier bedeutet. Vielleicht könnte ich in meiner Definition "Anzahl" durch "Anzahl unabhängiger Variablen" ersetzen. Ich denke, viele Leute wissen, was eine IV ist ... Interessante Frage!
Peter Flom
@PeterFlom, Sie haben Recht - wir tauschen eine mögliche Verwirrung gegen eine andere aus. Wenn Sie persönlich wissen, mit wem Sie sprechen, bezweifle ich, dass einer von uns Probleme haben würde. Die 1-Satz-Anforderung ist auch ziemlich eng; Gib mir ein paar Zahlen und 5 Minuten und ich kann jeden an Bord holen. Und um ganz klar zu sein, es war keine Kritik, ich mochte Ihre Antwort und habe sie positiv bewertet.
Gung - Reinstate Monica
5

Hier ist eine Definition, die AIC in der Menagerie der für die Modellauswahl verwendeten Techniken findet. AIC ist nur eine von mehreren vernünftigen Möglichkeiten, um den Kompromiss zwischen Anpassungsgüte (der durch Hinzufügen von Modellkomplexität in Form zusätzlicher erklärender Variablen oder Hinzufügen von Vorbehalten wie "aber nur am Donnerstag, wenn es regnet") und Sparsamkeit zu erfassen (einfacher == besser) beim Vergleich nicht verschachtelter Modelle. Hier ist das Kleingedruckte:

  1. Ich glaube, die Definition des OP gilt nur für lineare Modelle. Für Dinge wie Probits werden die AIC normalerweise in Bezug auf die Log-Wahrscheinlichkeit definiert.
  2. Einige andere Kriterien sind (das die geringste Anpassung für zusätzliche erklärende Variablen aufweist), Kullback-Leibler IC, BIC / SC und noch exotischere Kriterien, wie das Vorhersagekriterium von Amemiya, das in der Wildnis der angewandten Arbeit selten zu finden ist . Diese Kriterien unterscheiden sich darin, wie stark sie die Komplexität des Modells beeinträchtigen. Einige haben argumentiert, dass der AIC dazu neigt, Modelle auszuwählen, die überparametrisiert sind, da die Strafe für die Modellgröße ziemlich gering ist. Der BIC / SC erhöht auch die Strafe, wenn die Stichprobengröße zunimmt, was wie eine praktische Dandy-Funktion erscheint.R2
  3. Ein guter Weg, um die Teilnahme an Amerikas Top Information Criterion zu umgehen, besteht darin, zuzugeben, dass diese Kriterien willkürlich sind und erhebliche Annäherungen an ihre Ableitung erforderlich sind, insbesondere im nichtlinearen Fall. In der Praxis sollte die Auswahl eines Modells aus einer Reihe von Modellen wahrscheinlich von der beabsichtigten Verwendung dieses Modells abhängen. Wenn der Zweck darin besteht, die Hauptmerkmale eines komplexen Problems zu erklären, sollte Sparsamkeit Gold wert sein. Wenn Vorhersage der Name des Spiels ist, sollte Sparsamkeit weniger teuer sein. Einige würden sogar hinzufügen, dass Theorie / Domänenwissen auch eine größere Rolle spielen sollte. In jedem Fall sollte das, was Sie mit dem Modell vorhaben, bestimmen, welches Kriterium Sie verwenden könnten.
  4. Für verschachtelte Modelle sollte der Standardhypothesentest ausreichen, der die Parameter auf Null beschränkt.
Dimitriy V. Masterov
quelle
3

Wie wäre es mit:

AIC hilft Ihnen dabei, das am besten passende Modell zu finden, das die wenigsten Variablen verwendet.

Wenn das in der nicht-technischen Richtung zu weit ist, lass es mich in den Kommentaren wissen und ich werde mir eine andere einfallen lassen.

sparc_spread
quelle
2
AIC implementiert Occams Rasiermesser?
Dilip Sarwate
@ Dilip - so weit hinter der Linie, dass Sie die Linie nicht mehr sehen können - lol, danke. Ich denke, ich werde etwas zwischen Peter und meinem verwenden.
Rosser
3

AIC ist ein Maß dafür, wie gut die Daten durch das Modell erklärt werden, korrigiert um die Komplexität des Modells.

John
quelle
2

Die Kehrseite von @ gungs ausgezeichneter Antwort:

Der AIC ist eine Zahl, die misst, wie gut ein Modell zu einem Datensatz passt, und zwar auf einer gleitenden Skala, bei der komplexere Modelle wesentlich genauer sein müssen, um eine höhere Bewertung zu erzielen.

BEARBEITEN:

Der AIC ist eine Zahl, die misst, wie gut ein Modell zu einem Datensatz passt, auf einer gleitenden Skala, die Modelle erfordert, die wesentlich ausgefeilter oder flexibler sind, um auch wesentlich genauer zu sein.

Wayne
quelle
+1, das ist gut, aber um ehrlich zu sein, mag ich Ihren "Bestrafungs" -Vorschlag besser. Ich kann mir Leute vorstellen, die nicht verstehen würden, was Sie unter "ausarbeiten" verstehen.
Gung - Reinstate Monica
@gung: Ich stimme zu, dass dies nicht ganz funktioniert, aber ich habe versucht, die Lücke zwischen "Modellen" und "Erklärungen" zu schließen, wo sich die Leute vielleicht vorstellen können, dass eine ausführlichere Erklärung genauer sein müsste, um dies zu tun begründen Sie die zusätzlichen Wörter.
Wayne
-1

AIC=2k2ln(MaxL)

Angesichts dieser Definition ist der AIC ein Kriterium für die Auswahl des Modells, das den besten Kompromiss zwischen der geringen Anzahl von Parametern und der maximalen Wahrscheinlichkeit für die Schätzung dieser Parameter ergibt.

Jean-Victor Côté
quelle