Ich habe Daten darüber, wie viele Benutzer wie viele Fragen posten. Beispielsweise,
[UserCount, QuestionCount]
[2, 100]
[9, 10]
[3, 80]
... ...
Dies bedeutet, dass 2 Benutzer jeweils 100 Fragen, 9 Benutzer jeweils 10 Fragen usw. stellten. Wie kann ich also feststellen, ob die UserCount, QuestionCount
Verteilung einem Potenzgesetz folgt?
Ich habe das poweRlaw-Paket gefunden . Für die Auswertung kann ich jedoch nur eine Zahlengruppe übergeben. (Das in diesem Paket bereitgestellte Beispiel ist die Worthäufigkeit.) Wie verwende ich dieses Paket? Oder habe ich etwas falsch gemacht? Ich habe auch die Daten der Fragezählung jedes Benutzers, dh [100, 100, 10, 10, 10 ... ]
. Was bekomme ich, wenn ich diese Daten an das Paket weitergebe?
r
hypothesis-testing
goodness-of-fit
power-law
Dienstag
quelle
quelle
Antworten:
So testen Sie laut Clauset et al. Das Potenzgesetz tail with
poweRlaw
package:Die letzten beiden Zeilen können als eine Zeile umgeschrieben werden
Außerdem sehen Sie an dieser Stelle die KS-Statistik:
Dies kann einige Zeit dauern, also nehmen Sie sich eine Tasse Tee ...
poweRlaw
compare_distributions
comp
comp$test_statistic
data_pl
comp$p_two_side
Wiederholen Sie diesen Schritt mit
disexp
,dispois
Klassen Potenzgesetz mit diesen Alternativen zu vergleichen.quelle
data("moby")
undmoby
anstelle vondata
in meinem Beispiel verwenden, wie in der Einführung