Was ist der Unterschied zwischen dem Logit- und dem Probit-Modell ? Ich bin hier mehr daran interessiert zu wissen, wann man logistische Regression und wann man Probit einsetzt. Wenn es Literatur gibt, die es mit R definiert , wäre das ebenfalls
Bezieht sich auf jedes Modell, bei dem eine Zufallsvariable durch eine Funktion, die in einer endlichen Anzahl von Parametern linear ist, mit einer oder mehreren Zufallsvariablen verknüpft ist.
Was ist der Unterschied zwischen dem Logit- und dem Probit-Modell ? Ich bin hier mehr daran interessiert zu wissen, wann man logistische Regression und wann man Probit einsetzt. Wenn es Literatur gibt, die es mit R definiert , wäre das ebenfalls
Was ist der Unterschied zwischen linearer und logistischer Regression? Wann würden Sie jeweils
Ich verwende lineare Regressionsmodelle und frage mich, unter welchen Bedingungen der Intercept-Term entfernt werden kann. Beim Vergleich der Ergebnisse von zwei verschiedenen Regressionen, bei denen die eine den Achsenabschnitt hat und die andere nicht, stelle ich fest, dass das der Funktion...
In einem einfachen linearen Modell mit einer einzelnen erklärenden Variablen αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Ich finde, dass das Entfernen des Intercept-Terms die Anpassung stark verbessert (der Wert von geht von 0,3 auf 0,9). Der Intercept-Term...
Der Pearson-Korrelationskoeffizient von x und y ist der gleiche, unabhängig davon, ob Sie Pearson (x, y) oder Pearson (y, x) berechnen. Dies legt nahe, dass eine lineare Regression von y bei x oder x bei y gleich sein sollte, aber ich denke nicht, dass dies der Fall ist. Kann jemand Aufschluss...
Was bedeutet im Allgemeinen, dass der Bruchteil der Varianz in einer Analyse wie PCA durch die erste Hauptkomponente erklärt wird? Kann jemand dies intuitiv erklären, aber auch eine genaue mathematische Definition dessen geben, was "erklärte Varianz" im Sinne der Hauptkomponentenanalyse (PCA)...
Welche diagnostischen Diagramme (und möglicherweise formalen Tests) sind für Regressionen, bei denen das Ergebnis eine Zählvariable ist, am aussagekräftigsten? Ich interessiere mich besonders für Poisson- und negative Binomialmodelle sowie für Gegenstücke mit Null-Inflation und Hürden. Die meisten...
Die Gammaverteilung kann eine große Bandbreite von Formen annehmen, und angesichts des Zusammenhangs zwischen Mittelwert und Varianz durch ihre beiden Parameter scheint sie geeignet zu sein, die Heteroskedastizität in nicht negativen Daten auf eine Art und Weise zu behandeln, wie dies bei...
Ich beginne mit der Verwendung von dabble glmnetmit LASSO Regression , wo mein Ergebnis von Interesse dichotomous ist. Ich habe unten einen kleinen nachgebildeten Datenrahmen erstellt: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45,...
Ich habe einen Datensatz mit ungefähr 30 unabhängigen Variablen und möchte ein verallgemeinertes lineares Modell (GLM) erstellen, um die Beziehung zwischen ihnen und der abhängigen Variablen zu untersuchen. Mir ist bewusst, dass die Methode, die mir für diese Situation beigebracht wurde, die...
Ich habe festgestellt, dass das Konfidenzintervall für vorhergesagte Werte in einer linearen Regression um den Mittelwert des Prädiktors und Fett um den minimalen und den maximalen Wert des Prädiktors eng ist. Dies ist in den Diagrammen dieser 4 linearen Regressionen zu sehen: Anfangs dachte ich,...
Was ist der Unterschied zwischen den Begriffen "Link-Funktion" und "Canonical Link-Funktion"? Gibt es auch irgendwelche (theoretischen) Vorteile, wenn man eins gegenüber dem anderen verwendet? Beispielsweise kann eine binäre Antwortvariable unter Verwendung vieler Verknüpfungsfunktionen wie logit ,...
Wie kann ich die Haupteffekte (Koeffizienten für Dummy-codierten Faktor) in einer Poisson-Regression interpretieren? Nehmen wir das folgende Beispiel an: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2,...
Bei der Beantwortung dieser Frage schlug John Christie vor, die Anpassung logistischer Regressionsmodelle durch Auswertung der Residuen zu bewerten. Ich kenne mich mit der Interpretation von Residuen in OLS aus. Sie sind im selben Maßstab wie die DV und sehr deutlich der Unterschied zwischen y und...
Es wird oft empfohlen, die Quadratwurzel zu ziehen, wenn Sie Daten zählen. (Beispiele auf CV finden @ HarveyMotulsky Antwort hier oder @ whuber Antwort hier .) Auf der anderen Seite, wenn ein allgemeines lineares Modell mit einer Reaktionsvariable passend als Poisson verteilte, ist das Protokoll...
Auf dieser Website gibt es mehrere Themen mit Buchempfehlungen zu Einführungsstatistiken und maschinellem Lernen. Ich suche jedoch nach einem Text zu erweiterten Statistiken, der nach Priorität geordnet ist: maximale Wahrscheinlichkeit, verallgemeinerte lineare Modelle, Hauptkomponentenanalyse,...
Ich versuche die Philosophie zu verstehen, die hinter der Verwendung eines generalisierten linearen Modells (GLM) gegenüber einem linearen Modell (LM) steckt. Ich habe unten einen Beispieldatensatz erstellt: Log( y) = x + εLog(y)=X+ε\log(y) = x + \varepsilon Das Beispiel hat nicht den Fehler als...
Nehmen wir an, ich habe ein Klassenobjekt glm(das einem logistischen Regressionsmodell entspricht) und möchte die predict.glmmit dem Argument angegebenen vorhergesagten Wahrscheinlichkeiten type="response"in binäre Antworten umwandeln, dh oder . Was ist der schnellste und kanonischste Weg, dies in...
Ich habe es mit linearen Daten mit Ausreißern zu tun, von denen einige um mehr als 5 Standardabweichungen von der geschätzten Regressionslinie abweichen. Ich suche nach einer linearen Regressionstechnik, die den Einfluss dieser Punkte verringert. Bisher habe ich die Regressionsgerade mit allen...
Wie sind sie alle Versionen der gleichen statistischen