Wir haben den beobachteten Daten eine nichtlineare Funktion angepasst. Der nächste Schritt sollte die Beurteilung der Anpassungsgüte dieser Funktion sein (wie für lineare Modelle).
Was sind die üblichen Methoden, um dies zu messen?
Bearbeiten 1:
Die Anpassung wurde wie folgt durchgeführt:
- Führen Sie eine lineare Regression mit unabhängigen Variablen A und B durch .
- Berechnen Sie die Verteilungsparameter aus den Regressionsparametern. (Die Verteilung ist nichtlinear und hat die Variable C als Eingabe.)
- Bewerten Sie die Anpassungsgüte der nichtlinearen Verteilung, indem Sie die geschätzten mit den beobachteten Daten vergleichen.
Bearbeiten 2:
Beispiele für die oben genannten Schritte:
- Regressionsmodell:
- undθ=β2für die folgende nichtlineare Verteilung:f(a)=ρ⋅a-θ
goodness-of-fit
nonlinear
Marco
quelle
quelle
Antworten:
Vielleicht steckt noch mehr dahinter, aber für mich scheint es, dass Sie nur die Anpassungsgüte (GoF) für eine Funktion f (a) bestimmen möchten , die an einen bestimmten Datensatz (a, f (a)) angepasst ist. Das Folgende beantwortet also nur Ihre dritte Unterfrage (ich denke nicht, dass die erste und die zweite direkt für die dritte relevant sind).
Normalerweise GoF bestimmt werden parametrisch (wenn Sie die Verteilung der Funktionsparameter kennen) oder nicht-parametrisch (wenn Sie nicht wissen , sie). Möglicherweise können Sie Parameter für die Funktion ermitteln, da diese exponentiell oder gamma / weibull zu sein scheint (vorausgesetzt, die Daten sind kontinuierlich). Trotzdem werde ich fortfahren, als ob Sie die Parameter nicht kennen. In diesem Fall handelt es sich um einen zweistufigen Prozess . Zunächst müssen Sie die Verteilungsparameter für Ihren Datensatz bestimmen . Zweitens führen Sie einen GoF-Test für die definierte Verteilung durch. Um zu vermeiden, dass ich mich wiederhole, verweise ich Sie an dieser Stelle auf meine frühere Antwortauf eine verwandte Frage, die einige hilfreiche Details enthält. Offensichtlich kann diese Antwort leicht auf andere als die darin erwähnten Verteilungen angewendet werden.
Zusätzlich zu den dort erwähnten GoF-Tests können Sie einen anderen Test in Betracht ziehen - den Chi-Quadrat-GoF-Test . Im Gegensatz zu KS und AD - Tests, die nur für kontinuierliche Verteilungen anwendbar sind, Chi-Quadrat - Test GoF ist anwendbar auf beiden diskret und kontinuierlich denjenigen. Der Chi-Quadrat-GoF-Test kann in R unter Verwendung eines von mehreren Paketen durchgeführt werden:
stats
integriertes Paket (Funktionchisq.test()
) undvcd
Paket (Funktiongoodfit()
- nur für diskrete Daten). Weitere Details finden Sie in diesem Dokument .quelle
Nun, beim maschinellen Lernen wird die so genannte Kreuzvalidierung ziemlich häufig zum Zweck des Modelltests durchgeführt (testen Sie, ob dieser Modelltyp mit diesen Hyperparametern - wie der Anzahl der Freiheitsgrade oder was auch immer - zu Ihrem Problem passt) - Sie teilen Ihr Problem auf Daten mehrmals in Zug- und Testdatensätze einfügen, dann die Optimierung über den Trainingssatz ausführen und die Qualität über die Testdaten berechnen. Der vertraulichste Weg ist die sogenannte "QxT-fache Kreuzvalidierung". Der Pseudocode könnte mögen:
quelle