Statistiken und Big Data

15
Auf welcher Ebene ist ein

HINTERGRUND: Sicher überspringen - dient als Referenz und zur Rechtfertigung der Frage. Die Eröffnung dieses Papiers lautet: "Karl Pearsons berühmter Chi-Quadrat-Kontingenztest leitet sich aus einer anderen Statistik ab, die als z-Statistik bezeichnet wird und auf der Normalverteilung basiert....

15
Kann ein Modell für nicht negative Daten mit Nullen (Tweedie-GLM, null-aufgeblähtes GLM usw.) genaue Nullen vorhersagen?

Eine Tweedie-Verteilung kann verzerrte Daten mit einer Punktmasse von Null modellieren, wenn der Parameter (Exponent in der Mittelwert-Varianz-Beziehung) zwischen 1 und 2 liegt.ppp In ähnlicher Weise kann ein Modell mit Null-Inflation (unabhängig davon, ob es sich um ein kontinuierliches oder ein...

15
Wenn „Standardfehler“ und „Konfidenzintervalle“ die Messgenauigkeit messen, was sind dann die Messungen der Genauigkeit?

Im Buch "Biostatistik für Dummies" auf Seite 40 las ich: Der Standardfehler (abgekürzt SE) ist eine Möglichkeit anzugeben, wie genau Ihre Schätzung oder Messung von etwas ist. und Konfidenzintervalle bieten eine andere Möglichkeit, die Genauigkeit einer Schätzung oder Messung von etwas anzugeben....

15
Hohe Varianz der einmaligen Kreuzvalidierung

Ich habe immer wieder gelesen, dass die Kreuzvalidierung "Auslassen" aufgrund der großen Überlappung der Trainingsfalten eine hohe Varianz aufweist. Ich verstehe jedoch nicht, warum das so ist: Sollte die Leistung der Kreuzvalidierung nicht sehr stabil sein (geringe Varianz), gerade weil die...

15
Wann sollte man aufhören, ein Modell zu verfeinern?

Ich habe in den letzten 3 Jahren Statistiken aus vielen Büchern studiert und dank dieser Seite viel gelernt. Dennoch bleibt für mich eine grundlegende Frage offen. Es mag eine sehr einfache oder eine sehr schwierige Antwort geben, aber ich weiß, dass es ein tiefes Verständnis der Statistik...

15
Das pdf von

Angenommen , X1, X2, . . . , XnX1,X2,...,XnX_1, X_2,...,X_n sei iid aus N( μ , σ2)N(μ,σ2)N(\mu,\sigma^2) mit unbekanntem μ ∈ Rμ∈R\mu \in \mathcal R und σ2> 0σ2>0\sigma^2>0 Sei Z=X1−X¯S,Z=X1−X¯S,Z=\frac{X_1-\bar{X}}{S},S ist hier die Standardabweichung. Es kann gezeigt werden, dass ZZZ die...

15
Die Linearität der Varianz

Ich denke, die folgenden zwei Formeln sind wahr: Var(aX)=a2Var(X)Var(aX)=a2Var(X) \mathrm{Var}(aX)=a^2 \mathrm{Var}(X) während a eine konstante Zahl ist wenn , unabhängig sindVar(X+Y)=Var(X)+Var(Y)Var(X+Y)=Var(X)+Var(Y) \mathrm{Var}(X + Y)=\mathrm{Var}(X)+\mathrm{Var}(Y) XXXYYY Ich bin mir...

15
Zufälliges Parameterproblem

Ich bemühe mich immer, die wahre Essenz des Problems der zufälligen Parameter zu finden. Ich habe mehrmals gelesen, dass die Fixeffektschätzer von nichtlinearen Paneldatenmodellen aufgrund des "bekannten" zufälligen Parameterproblems stark verzerrt sein können. Wenn ich nach einer klaren Erklärung...