Weiß jemand, wie man herausfindet, ob die Punkte 7, 16 und 29 Einflusspunkte sind oder nicht? Ich habe irgendwo gelesen, dass Cooks Entfernung kleiner als 1 ist, sie aber nicht. Habe ich recht?
Diagnosemaßnahmen (wie Residuen oder einige aus Residuen berechnete zusammenfassende Statistiken) werden verwendet, um einen Aspekt der Qualität der Modellanpassung an Daten zu bewerten.
Weiß jemand, wie man herausfindet, ob die Punkte 7, 16 und 29 Einflusspunkte sind oder nicht? Ich habe irgendwo gelesen, dass Cooks Entfernung kleiner als 1 ist, sie aber nicht. Habe ich recht?
Ich suche nach Richtlinien zur Interpretation von Residuendiagrammen von glm-Modellen. Insbesondere Poisson-, Negativ-Binomial- und Binomial-Modelle. Was können wir von diesen Darstellungen erwarten, wenn die Modelle "korrekt" sind? (Wir erwarten beispielsweise, dass die Varianz mit zunehmendem...
Ich wollte eine Klassendemonstration durchführen, bei der ich ein t-Intervall mit einem Bootstrap-Intervall vergleiche und die Überdeckungswahrscheinlichkeit für beide berechne. Ich wollte, dass die Daten aus einer verzerrten Verteilung stammen, also habe ich mich dafür entschieden, die Daten als...
Angenommen, ich werde eine univariate logistische Regression für mehrere unabhängige Variablen durchführen: mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) Ich habe einen Modellvergleich (Likelihood Ratio Test)...
Nach meiner Frage an OLS frage ich mich: Welche diagnostischen Diagramme gibt es für die Quantilregression? (Und gibt es R Implementierung von ihnen?) Bei einer schnellen Google-Suche wurde bereits das Wurmdiagramm gefunden (von dem ich noch nie gehört habe), und ich würde mich über weitere...
Ein Signalerfassungsexperiment präsentiert dem Beobachter (oder Diagnosesystem) typischerweise entweder ein Signal oder ein Nicht-Signal, und der Beobachter wird gebeten zu melden, ob er den präsentierten Gegenstand für ein Signal oder ein Nicht-Signal hält. Solche Experimente liefern Daten, die...
Ich verwende einen Metropolis-Sampler (C ++) und möchte die Konvergenzrate anhand der vorherigen Samples schätzen. Eine einfach zu implementierende Diagnose, die ich gefunden habe, ist die Geweke-Diagnose , die die Differenz zwischen den beiden Stichprobenmitteln dividiert durch ihren geschätzten...
Ich habe mein Modell angepasst und versuche zu verstehen, ob es etwas Gutes ist. Ich habe die empfohlenen Metriken berechnet, um sie zu bewerten ( / AUC / Genauigkeit / Vorhersagefehler / usw.), weiß aber nicht, wie ich sie interpretieren soll. Kurz gesagt, wie kann ich anhand der Metrik...
Ich habe Formeln auf Wikipedia gesehen. die Mahalanobis Distanz und Hebelwirkung in Beziehung setzen: Der Mahalanobis-Abstand hängt eng mit der Verschuldungsstatistik , hat jedoch eine andere Skala:hhhD2=(N−1)(h−1N).D2=(N−1)(h−1N).D^2 = (N - 1)(h - \tfrac{1}{N}). In einem verlinkten Artikel...
Mir ist der Ramsey-Reset-Test bekannt, der möglicherweise nichtlineare Abhängigkeiten erkennt. Wenn Sie jedoch nur einen der Regressionskoeffizienten (lediglich lineare Abhängigkeiten) wegwerfen, können Sie abhängig von den Korrelationen eine Verzerrung erhalten. Dies wird vom Reset-Test...
Ich beobachte seltsame Muster in Residuen für meine Daten: [EDIT] Hier sind die partiellen Regressionsdiagramme für die beiden Variablen: [EDIT2] Das PP-Diagramm wurde hinzugefügt Die Verteilung scheint in Ordnung zu sein (siehe unten), aber ich habe keine Ahnung, woher diese gerade Linie kommen...
Bei einer einfachen linearen Regression möchte man oft überprüfen, ob bestimmte Annahmen erfüllt sind, um Rückschlüsse ziehen zu können (z. B. sind Residuen normalverteilt). Ist es sinnvoll, die Annahmen zu überprüfen, indem überprüft wird, ob die angepassten Werte normal verteilt sind?...
Ich habe angefangen, ein bisschen in die Funktion plot.lm zu graben . Diese Funktion gibt sechs Diagramme für lm an. Sie sind: eine Darstellung der Residuen gegen angepasste Werte ein Scale-Location-Diagramm von sqrt (| Residuen |) gegen angepasste Werte Ein normales QQ-Diagramm, ein Diagramm der...
Ich habe halbstündliche Nachfragedaten, bei denen es sich um eine multisaisonale Zeitreihe handelt. Ich habe tbatsin forecastPaket in R verwendet und habe folgende Ergebnisse erhalten: TBATS(1, {5,4}, 0.838, {<48,6>, <336,6>, <17520,5>}) Bedeutet dies, dass die Serie nicht...
Gibt es bestimmte Annahmen bezüglich der Fehler für die logistische Regression, wie die konstante Varianz der Fehlerterme und die Normalität der Residuen? Entfernen Sie diese normalerweise auch, wenn Sie Punkte haben, deren Kochabstand größer als 4 / n ist? Wenn Sie sie entfernen, wie können Sie...
Bevor ich diese Frage stellte, habe ich unsere Website durchsucht und viele ähnliche Fragen gefunden (wie hier , hier und hier ). Ich bin jedoch der Meinung, dass diese verwandten Fragen nicht gut beantwortet oder diskutiert wurden, und möchte diese Frage daher erneut stellen. Ich denke, es sollte...
Standardunterricht besagt, dass Sensitivität und Spezifität Eigenschaften des Tests sind und unabhängig von der Prävalenz. Aber ist das nicht nur eine Annahme? Harrisons Prinzipien der Inneren Medizin 19. Ausgabe sagt Es ist seit langem behauptet worden, dass Sensitivität und Spezifität...
Wenn ich eine multiple lineare OLS-Regression durchführe, anstatt die Residuen gegen angepasste Werte zu zeichnen, zeichne ich die (internen) studentisierten Residuen gegen angepasste Werte (ebenso für Kovariaten). Diese Residuen sind definiert
Ich versuche zu replizieren, was die Funktion dfbetas()in R tut . dfbeta() ist kein Problem ... Hier ist eine Reihe von Vektoren: x <- c(0.512, 0.166, -0.142, -0.614, 12.72) y <- c(0.545, -0.02, -0.137, -0.751, 1.344) Wenn ich zwei Regressionsmodelle wie folgt anpasse: fit1 <- lm(y ~...
Lassen Sie mich zunächst einmal sagen, dass ich vor 38 Jahren einen Statistikkurs in der Ingenieurschule hatte. Also fliege ich hier blind. Ich habe die Ergebnisse von im Wesentlichen 18 separaten diagnostischen Tests für eine Krankheit. Jeder Test ist binär - ja / nein, ohne Schwellenwert, der...