In den Kommentaren unter einem meiner Beiträge diskutierten Glen_b und ich, wie diskrete Verteilungen notwendigerweise einen abhängigen Mittelwert und eine abhängige Varianz haben.
Für eine Normalverteilung ist es sinnvoll. Wenn ich Ihnen sage , haben Sie keine Ahnung, was ist, und wenn ich Ihnen sage , haben Sie keine Ahnung, was ist. (Bearbeitet, um die Stichprobenstatistik und nicht die Populationsparameter zu berücksichtigen.)
Aber gilt für eine diskrete Gleichverteilung nicht dieselbe Logik? Wenn ich den Mittelpunkt der Endpunkte schätze, kenne ich den Maßstab nicht, und wenn ich den Maßstab schätze, kenne ich den Mittelpunkt nicht.
Was läuft falsch mit meinem Denken?
BEARBEITEN
Ich habe Jbowmans Simulation gemacht. Dann habe ich es mit der Wahrscheinlichkeitsintegraltransformation (glaube ich) getroffen, um die Beziehung ohne Einfluss der Randverteilungen zu untersuchen (Isolierung der Kopula).
Data.mean <- Data.var <- rep(NA,20000)
for (i in 1:20000){
Data <- sample(seq(1,10,1),100,replace=T)
Data.mean[i] <- mean(Data)
Data.var[i] <- var(Data)
}
par(mfrow=c(2,1))
plot(Data.mean,Data.var,main="Observations")
plot(ecdf(Data.mean)(Data.mean),ecdf(Data.var)(Data.var),main="'Copula'")
In dem kleinen Bild, das in RStudio angezeigt wird, sieht das zweite Diagramm so aus, als hätte es eine einheitliche Abdeckung des Einheitsquadrats, also Unabhängigkeit. Beim Vergrößern gibt es deutliche vertikale Bänder. Ich denke, das hat mit der Diskretion zu tun und ich sollte nicht hineinlesen. Ich habe es dann für eine kontinuierliche Gleichverteilung auf versucht .
Data.mean <- Data.var <- rep(NA,20000)
for (i in 1:20000){
Data <- runif(100,0,10)
Data.mean[i] <- mean(Data)
Data.var[i] <- var(Data)
}
par(mfrow=c(2,1))
plot(Data.mean,Data.var)
plot(ecdf(Data.mean)(Data.mean),ecdf(Data.var)(Data.var))
Dieser sieht wirklich so aus, als hätte er Punkte, die gleichmäßig über das Einheitsquadrat verteilt sind, daher bin ich skeptisch, dass und unabhängig sind.
Antworten:
Die Antwort von jbowman (+1) erzählt einen Großteil der Geschichte. Hier ist ein bisschen mehr.
(a) Für Daten aus einer kontinuierlichen Gleichverteilung sind der Stichprobenmittelwert und die SD nicht korreliert, aber nicht unabhängig. Die "Umrisse" der Handlung betonen die Abhängigkeit. Bei kontinuierlichen Verteilungen gilt die Unabhängigkeit nur für den Normalbereich.
(c) Eine gerundete Normalverteilung ist nicht normal. Diskretion verursacht Abhängigkeit.
Nachtrag pro Kommentar.
quelle
Es ist nicht so, dass der Mittelwert und die Varianz bei diskreten Verteilungen abhängig sind, sondern dass der Stichprobenmittelwert und die Varianz angesichts der Parameter der Verteilung abhängig sind . Der Mittelwert und die Varianz selbst sind feste Funktionen der Verteilungsparameter, und Konzepte wie "Unabhängigkeit" gelten nicht für sie. Folglich stellen Sie sich die falschen hypothetischen Fragen.
Natürlich kann ein Beispiel Glen's Vermutung in dem von Ihnen verlinkten Beitrag nicht beweisen, dass keine diskrete Verteilung mit unabhängigen Stichprobenmitteln und Varianzen existiert!
quelle