Ich habe versucht, meine Daten in verschiedene Modelle einzufügen, und dabei herausgefunden, dass die fitdistr
Funktion aus der Bibliothek MASS
von R
mir Negative Binomial
die beste Anpassung ergibt . Auf der Wiki- Seite lautet die Definition nun:
Die NegBin (r, p) -Verteilung beschreibt die Wahrscheinlichkeit von k Fehlern und r Erfolgen in k + r Bernoulli (p) -Studien mit Erfolg in der letzten Studie.
Wenn R
ich Modellanpassungen durchführe, erhalte ich zwei Parameter mean
und dispersion parameter
. Ich verstehe nicht, wie ich diese interpretieren soll, da ich diese Parameter auf der Wiki-Seite nicht sehen kann. Alles was ich sehen kann ist die folgende Formel:
wo k
ist die Anzahl der Beobachtungen und r=0...n
. Wie beziehe ich diese nun mit den Parametern von R
? Die Hilfedatei enthält ebenfalls nicht viele Informationen.
Um nur ein paar Worte zu meinem Experiment zu sagen: In einem sozialen Experiment, das ich durchführte, habe ich versucht, die Anzahl der Personen zu zählen, die jeder Benutzer in einem Zeitraum von 10 Tagen kontaktiert hat. Die Populationsgröße betrug 100 für das Experiment.
Wenn das Modell zum negativen Binomial passt, kann ich blind sagen, dass es dieser Verteilung folgt, aber ich möchte die intuitive Bedeutung dahinter wirklich verstehen. Was bedeutet es zu sagen, dass die Anzahl der von meinen Testpersonen kontaktierten Personen einer negativen Binomialverteilung folgt? Kann jemand bitte helfen, dies zu klären?
quelle
Wie ich bereits in meinem früheren Beitrag an Sie erwähnt habe, arbeite ich daran, eine Distribution so anzupassen, dass auch Daten gezählt werden. Folgendes habe ich gelernt:
Wenn die Varianz größer als der Mittelwert ist, ist eine Überdispersion offensichtlich und daher ist die negative Binomialverteilung wahrscheinlich angemessen. Wenn die Varianz und der Mittelwert gleich sind, wird die Poisson-Verteilung vorgeschlagen, und wenn die Varianz kleiner als der Mittelwert ist, wird die Binomialverteilung empfohlen.
Mit den Zähldaten, an denen Sie arbeiten, verwenden Sie die "ökologische" Parametrisierung der Negative Binomial-Funktion in R. Auf diese wird (im Kontext) in Abschnitt 4.5.1.3 (Seite 175) des folgenden frei verfügbaren Buches speziell hingewiesen von R, nicht weniger!) und ich hoffe, einige Ihrer Fragen beantworten zu können:
http://www.math.mcmaster.ca/~bolker/emdbook/book.pdf
Wenn Sie zu dem Schluss kommen, dass Ihre Daten null-abgeschnitten sind (dh die Wahrscheinlichkeit von 0 Beobachtungen ist 0), möchten Sie möglicherweise die null-abgeschnittene Variante des NBD überprüfen, der im R VGAM-Paket enthalten ist .
Hier ist ein Beispiel für die Anwendung:
Ich hoffe das ist hilfreich.
quelle