Statistiken und Big Data

11
Teilen Sie die Daten in N gleiche Gruppen auf

Ich habe einen Datenrahmen, der Werte in 4 Spalten enthält: Zum Beispiel: ID, price, click count,rating Was ich tun möchte, ist, diesen Datenrahmen in N verschiedene Gruppen "aufzuteilen", wobei jede Gruppe die gleiche Anzahl von Zeilen mit der gleichen Verteilung von Preis-, Klickzahl- und...

11
Interpretieren von gekerbten Boxplots

Während ich eine EDA durchführte, entschied ich mich, ein Box-Diagramm zu verwenden, um den Unterschied zwischen zwei Ebenen eines Faktors zu veranschaulichen. Die Art und Weise, wie ggplot das Box-Diagramm renderte, war zufriedenstellend, aber leicht vereinfacht (erstes Diagramm unten). Während...

11
Warum liefert die eingeschränkte maximale Wahrscheinlichkeit eine bessere (unvoreingenommene) Schätzung der Varianz?

Ich lese Doug Bates ' Theoriepapier über Rs lme4-Paket, um das Wesentliche gemischter Modelle besser zu verstehen, und bin auf ein faszinierendes Ergebnis gestoßen, das ich besser verstehen möchte, wenn es darum geht, die Varianz mithilfe der eingeschränkten maximalen Wahrscheinlichkeit (REML) zu...

11
Gesamt-p-Wert und paarweise p-Werte?

Ich habe ein allgemeines lineares Modell dessen Protokollwahrscheinlichkeit .y=β0+β1x1+β2x2+β3x3,y=β0+β1x1+β2x2+β3x3,y=\beta_0+\beta_1x_1+\beta_2x_2+\beta_3x_3,LuLuL_u Jetzt möchte ich testen, ob die Koeffizienten gleich sind. Erstens Gesamttest : Die Log-Wahrscheinlichkeit des reduzierten...

11
So simulieren Sie zensierte Daten

Ich frage mich, wie ich eine Stichprobe von n Weibull-Verteilungslebensdauern simulieren kann, die rechtszensierte Beobachtungen vom Typ I enthalten. Zum Beispiel haben wir n = 3, Form = 3, Skala = 1 und die Zensurrate = 0,15 und die Zensurzeit = 0,88. Ich weiß, wie man eine Weibull-Stichprobe...

11
Bayesianische Modellauswahl in PyMC3

Ich verwende PyMC3, um Bayes'sche Modelle für meine Daten auszuführen. Ich bin neu in der Bayes'schen Modellierung, aber laut einigen Blog-Posts , Wikipedia und QA von dieser Website scheint es ein gültiger Ansatz zu sein, den Bayes-Faktor und das BIC-Kriterium zu verwenden, um auswählen zu...