Ich bin verwirrt mit der Definition eines nichtparametrischen Modells, nachdem ich diesen Link gelesen habe. Parametrische vs nichtparametrische Modelle und Antwortkommentare meiner anderen Frage .
Ursprünglich dachte ich, "parametrisch gegen nicht parametrisch" bedeutet, wenn wir Verteilungsannahmen für das Modell haben (ähnlich wie beim Testen parametrischer oder nicht parametrischer Hypothesen). Beide Ressourcen, die den Anspruch "parametrisch oder nicht parametrisch" haben, können jedoch dadurch bestimmt werden, ob die Anzahl der Parameter im Modell von der Anzahl der Zeilen in der Datenmatrix abhängt.
Für die Kernel-Dichteschätzung (nicht parametrisch) kann eine solche Definition angewendet werden. Aber wie kann ein neuronales Netzwerk unter dieser Definition ein nicht parametrisches Modell sein, da die Anzahl der Parameter im Modell von der Struktur des neuronalen Netzwerks und nicht von der Anzahl der Zeilen in der Datenmatrix abhängt?
Was genau ist der Unterschied zwischen einem parametrischen und einem nicht parametrischen Modell?
Antworten:
In einem parametrischen Modell ist die Anzahl der Parameter in Bezug auf die Stichprobengröße festgelegt. In einem nichtparametrischen Modell kann die (effektive) Anzahl von Parametern mit der Stichprobengröße zunehmen.
In einer OLS-Regression entspricht die Anzahl der Parameter immer der Länge von plus eins für die Varianz.β
Ein neuronales Netz mit fester Architektur und ohne Gewichtsabfall wäre ein parametrisches Modell.
Wenn Sie jedoch einen Gewichtsabfall haben, wird der Wert des durch Kreuzvalidierung ausgewählten Abklingparameters im Allgemeinen mit mehr Daten kleiner. Dies kann als Erhöhung der effektiven Anzahl von Parametern mit zunehmender Stichprobengröße interpretiert werden.
quelle
Ich denke, wenn das Modell als ein Satz von Gleichungen definiert ist (kann ein System von gleichzeitigen Gleichungen oder ein einzelnes sein) und wir seine Parameter lernen, dann ist es parametrisch. Dazu gehören Differentialgleichungen und sogar die Navier-Stokes-Gleichung. Deskriptiv definierte Modelle fallen unabhängig von ihrer Lösung in die Kategorie der nichtparametrischen Modelle. Somit wäre OLS parametrisch, und selbst die Quantilregression, obwohl sie in den Bereich der nichtparametrischen Statistik gehört, ist ein parametrisches Modell.
Wenn wir andererseits SEM (Strukturgleichungsmodellierung) verwenden, um das Modell zu identifizieren, wäre es ein nichtparametrisches Modell - bis wir das SEM gelöst haben. PCA wäre parametrisch, weil die Gleichungen gut definiert sind, aber CCA kann nichtparametrisch sein, weil wir nach Korrelationen über alle Variablen suchen, und wenn dies Spearmans Korrelationen sind, haben wir ein nichtparametrisches Modell. Mit Pearsons Korrelationen implizieren wir ein parametrisches (lineares) Modell. Ich denke, Clustering-Algorithmen wären nichtparametrisch, es sei denn, wir suchen nach Clustern bestimmter Form.
Und dann haben wir die nichtparametrische Regression, die nichtparametrisch ist, und die LOESS-Regression, die parametrisch ist, aber denselben Zweck erfüllt: Wir definieren die Gleichung und das Fenster.
quelle
quelle