Als «fitting» getaggte Fragen

8
Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?

Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly...

8
Frühes Stoppen gegen Kreuzvalidierung

Ich benutze derzeit ein frühes Anhalten in meiner Arbeit, um eine Überanpassung zu verhindern. Speziell diejenigen, die aus dem frühen Stoppen stammen, aber wann? . Ich möchte jetzt mit anderen Klassifizierungsalgorithmen vergleichen, bei denen es den Anschein hat, dass eine 10-fache...

8
Ein konkretes Beispiel ist die Durchführung einer SVD, um fehlende Werte zu unterstellen

Ich habe die großartigen Kommentare zum Umgang mit fehlenden Werten vor dem Anwenden von SVD gelesen, möchte aber anhand eines einfachen Beispiels wissen, wie dies funktioniert: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Wenn ich in der obigen Matrix die NA-Werte...

7
Warum werfen diese Daten einen Fehler in R fitdistr?

Ich versuche, eine weibliche Verteilung darauf anzupassen, habe aber Probleme. Nicht sicher warum. Was verursacht die NaNs? temp <- dput(temp) c(477.25, 2615.56, 1279.98, 581.57, 13.55, 80.4, 6640.22, 759.46, 1142.33, 134, 1232.23, 389.81, 7811.65, 992.11, 1152.4, 3139.01, 2636.78, 3294.75,...

7
Regression für das Machtrecht

Dies ist ein Crosspost von Math SE . Ich habe einige Daten (Laufzeit eines Algorithmus) und ich denke, dass sie einem Potenzgesetz folgen yr e g= k xeinyreg=kxay_\mathrm{reg} = k x^a Ich möchte und bestimmen . Was ich bisher getan habe, ist eine lineare Regression (kleinste Quadrate) durch und...

7
Warum führt die Kodierung der Behandlung zu einer Korrelation zwischen zufälliger Steigung und Schnittpunkt?

Betrachten Sie ein faktorielles Design innerhalb des Subjekts und innerhalb des Gegenstands, bei dem die experimentelle Behandlungsvariable zwei Ebenen (Bedingungen) aufweist. Sei m1das Maximalmodell und m2das No-Random-Correlations-Modell. m1: y ~ condition + (condition|subject) +...

7
Wie passt man am leichtesten über?

Das ist eine seltsame Frage, ich weiß. Ich bin nur ein Neuling und versuche, etwas über verschiedene Klassifikatoroptionen und deren Funktionsweise zu lernen. Also stelle ich die Frage: Bei einem Datensatz mit n1-Dimensionen und n2-Beobachtungen, bei dem jede Beobachtung in n3-Buckets...