Ich habe eine Stichprobe von Daten, die R
von generiert wurden rnorm(50,0,1)
, daher nehmen die Daten offensichtlich eine normale Verteilung an. Allerdings R
nicht „kennt“ diese verteilungs Informationen über die Daten.
Gibt es eine Methode R
, mit der sich abschätzen lässt, von welcher Verteilung meine Stichprobe stammt? Wenn nicht, werde ich die shapiro.test
Funktion nutzen und so vorgehen.
r
distributions
James Highbright
quelle
quelle
Antworten:
Es gibt die
fitdistr
Funktion im MASS-Paket oder einige der Funktionen im fitdistrplus-Paket . Hier einige Beispiele aus letzterem.so zum Beispiel
und Sie können die Handlungen mit sehen
so sieht es als normalverteilung plausibel aus
aber auch vielleicht als logistische Verteilung (Sie benötigen eine größere Stichprobe, um sie in den Schwänzen zu unterscheiden)
Mit einem qqplot und Blick auf die CDF können Sie jedoch feststellen, dass dies wahrscheinlich keine Cauchy-Distribution ist
quelle
fitdist
Liefert Schätzungen der Parameter. Es gibt einige Hinweise, wie die Verteilung von Funktionen sein könnte,descdist(dat, boot = 1000)
aber auch sie würden von einer größeren Stichprobe profitieren.fitdist()
ist eine Funktion im fitdistrplus-Paket, und diese habe ich verwendet. Inzwischenfitdistr()
ist eine Funktion im MASS-Paket und würde hier in dieser Form nicht funktionieren.plot(f1)
anstelle desplotdist(dat,"norm",para=list(mean=f1$estimate[1],sd=f1$estimate[2]))