Was sind die üblichen Annahmen für eine lineare Regression? Umfassen sie: eine lineare Beziehung zwischen der unabhängigen und abhängigen Variablen unabhängige Fehler Normalverteilung von Fehlern Homoskedastizität Gibt es noch
Bezieht sich auf die Bedingungen, unter denen ein Statistikverfahren gültige Schätzungen und / oder Schlussfolgerungen liefert. Beispielsweise erfordern viele statistische Techniken die Annahme, dass die Daten auf irgendeine Weise zufällig abgetastet werden. Theoretische Ergebnisse zu Schätzern erfordern normalerweise Annahmen über den Datenerzeugungsmechanismus.
Was sind die üblichen Annahmen für eine lineare Regression? Umfassen sie: eine lineare Beziehung zwischen der unabhängigen und abhängigen Variablen unabhängige Fehler Normalverteilung von Fehlern Homoskedastizität Gibt es noch
Ich arbeite derzeit an einem quasi-experimentellen Forschungspapier. Aufgrund der geringen Bevölkerungszahl in dem ausgewählten Gebiet habe ich nur eine Stichprobengröße von 15 und nur 15 entsprechen meinen Kriterien. Ist 15 die minimale Stichprobengröße, die für T-Test und F-Test berechnet werden...
Für eine Simulationsstudie muss ich Zufallsvariablen generieren, die eine vorab festgelegte (Populations-) Korrelation zu einer vorhandenen Variablen .Y.YY Ich sah in die RPakete copulaund CDVineder Zufall multivariate Verteilungen mit einer bestimmten Abhängigkeitsstruktur erzeugen kann. Es ist...
Die Wikipedia-Seite zu ANOVA enthält drei Annahmen : Unabhängigkeit von Fällen - Dies ist eine Annahme des Modells, die die statistische Analyse vereinfacht. Normalität - Die Verteilungen der Residuen sind normal. Gleichheit (oder "Homogenität") von Varianzen, Homoskedastizität genannt...
Ich nehme an, dass ich jedes Mal frustriert bin, wenn ich jemanden sagen höre, dass die Nichtnormalität von Residuen und / oder Heteroskedastizität gegen die OLS-Annahmen verstößt. Zur Schätzung von Parametern in einem OLS-Modell ist nach dem Gauß-Markov-Theorem keine dieser Annahmen erforderlich....
Auf dieser Site befinden sich mehrere Threads, in denen erläutert wird, wie ermittelt werden kann, ob die OLS-Residuen asymptotisch normal verteilt sind. Eine weitere Möglichkeit, die Normalität der Residuen mit R-Code zu bewerten, bietet diese hervorragende Antwort . Dies ist eine weitere...
Ich lerne die Überlebensanalyse aus diesem Beitrag über UCLA IDRE und bin in Abschnitt 1.2.1 aufgefallen . Das Tutorial sagt: ... wenn bekannt ist, dass die Überlebenszeiten exponentiell verteilt sind , dann die Wahrscheinlichkeit, eine Überlebenszeit zu beobachten ... Warum wird angenommen, dass...
Betrachten Sie die folgende Abbildung aus Faraways linearen Modellen mit R (2005, S. 59). Das erste Diagramm scheint darauf hinzudeuten, dass die Residuen und die angepassten Werte nicht korreliert sind, da sie in einem homoskedastischen linearen Modell mit normalverteilten Fehlern vorliegen...
Ich arbeite mit einem großen Datensatz (vertraulich, daher kann ich nicht zu viel teilen) und bin zu dem Schluss gekommen, dass eine negative binomische Regression erforderlich wäre. Ich habe noch nie zuvor eine glm-Regression durchgeführt, und ich kann keine klaren Informationen über die Annahmen...
Meine Frage ergibt sich aus diesem Kommentar in einem Blogbeitrag von Andrew Gelman, in dem er die Verwendung von 50% -Konfidenzintervallen anstelle von 95% -Konfidenzintervallen befürwortet, allerdings nicht aus dem Grund, dass diese robuster geschätzt werden: Ich bevorzuge Intervalle von 50% bis...
Ich versuche zu verstehen, was die Annahme unabhängiger Beobachtungen bedeutet. Einige Definitionen sind: "Zwei Ereignisse sind genau dann unabhängig, wenn ." ( Statistisches Wörterbuch )P(a∩b)=P(a)∗P(b)P(a∩b)=P(a)∗P(b)P(a \cap b) = P(a) * P(b) "Das Eintreten eines Ereignisses ändert nicht die...
Betrachten Sie als Beispiel den ChickWeightDatensatz in R. Die Varianz wächst offensichtlich mit der Zeit. Wenn ich also eine einfache lineare Regression verwende, wie: m <- lm(weight ~ Time*Diet, data=ChickWeight) Meine Fragen: Welche Aspekte des Modells werden fraglich sein? Beschränken...
Was passiert beim Anpassen eines Regressionsmodells, wenn die Annahmen der Ausgaben nicht erfüllt werden? Was passiert, wenn die Residuen nicht homoskedastisch sind? Wenn die Residuen ein zunehmendes oder abnehmendes Muster im Diagramm Residuen vs. Was passiert, wenn die Residuen nicht normal...
Ich habe gelernt, dass ich nicht die Rohdaten, sondern deren Residuen auf Normalität prüfen muss. Sollte ich Residuen berechnen und dann den Shapiro-Wilk-W-Test durchführen? Werden Residuen wie folgt berechnet: ?Xi−meanXi−meanX_i - \text{mean} Bitte sehen Sie diese vorherige Frage für meine Daten...
Der Mantel-Test wird normalerweise auf symmetrische Distanz- / Differenzmatrizen angewendet. Nach meinem Verständnis geht der Test davon aus, dass das zur Definition von Differenzen verwendete Maß mindestens eine Halbmetrik sein muss (den Standardanforderungen einer Metrik, aber nicht der...
Ich möchte aus meinen Umfragedaten ein logistisches Modell erstellen. Es handelt sich um eine kleine Umfrage unter vier Wohnkolonien, bei der nur 154 Befragte befragt wurden. Meine abhängige Variable ist "zufriedenstellender Übergang zur Arbeit". Ich fand heraus, dass von den 154 Befragten 73...
Ich habe einen wiederholten Entwurf durchgeführt, bei dem ich 30 Männer und 30 Frauen in drei verschiedenen Aufgaben getestet habe. Ich möchte verstehen, wie unterschiedlich sich Männer und Frauen verhalten und wie das von der jeweiligen Aufgabe abhängt. Ich habe sowohl das lmer- als auch das...
Ich habe gelesen, dass der t- Test "ziemlich robust" ist, wenn die Verteilung der Stichproben von der Normalität abweicht. Natürlich ist es die Stichprobenverteilung der Unterschiede, die wichtig sind. Ich habe Daten für zwei Gruppen. Eine der Gruppen ist in Bezug auf die abhängige Variable stark...
Ich bin ein bisschen verwirrt, was die Annahmen der linearen Regression sind. Bisher habe ich geprüft, ob: Alle erklärenden Variablen korrelierten linear mit der Antwortvariablen. (Dies war der Fall) es gab irgendeine Kollinearität zwischen den erklärenden Variablen. (Es gab wenig Kollinearität)....
Betrachten Sie das Standardmodell für die multiple Regression wobei gilt.ε ∼ N ( 0 , σ 2 I n )Y.= Xβ+ εY.=Xβ+εY=X\beta+\varepsilonε ∼ N( 0 , σ2ichn)ε∼N(0,σ2ichn)\varepsilon \sim \mathcal N(0, \sigma^2I_n) Angenommen, wir führen eine Gratregression durch, indem wir allen Elementen der Diagonale von...