Statistiken und Big Data

9
Die Whisker eines Boxplots verstehen

Ich habe eine Frage zur Interpretation der Whisker eines Boxplots. Ich habe Folgendes gelesen: "Oben und unten im Rechteck zeigen die" Whisker "den Bereich des 1,5-fachen Abstands zwischen den 0,25- und 0,75-Quantilen", verstehe aber nicht ganz, was unter "Abstand" zu verstehen ist. . Es kann...

9
Regression auf das mittlere Rätsel

Im Kapitel "Regression to the Mean" von Daniel Kahneman "Denken, schnell und langsam" wird ein Beispiel gegeben, und der Leser wird gebeten, den Umsatz einzelner Geschäfte anhand der Gesamtumsatzprognose und der Verkaufszahlen des Vorjahres zu prognostizieren . Zum Beispiel (das Beispiel des Buches...

9
Was ist der Unterschied zwischen der Maximierung der bedingten (logarithmischen) Wahrscheinlichkeit oder der gemeinsamen (logarithmischen) Wahrscheinlichkeit bei der Schätzung der Parameter eines Modells?

Betrachten Sie eine Antwort y und Datenmatrix X . Angenommen, ich erstelle ein Modell des Formulars - y ~ g (X, )θθ\theta (g () könnte eine beliebige Funktion von X und )θθ\theta Zur Schätzung von θθ\theta Verwendung der Maximum Likelihood (ML) -Methode könnte ich entweder mit der bedingten ML...

9
Was ist mit dem „Level“ einer Zeitreihe gemeint?

In einem Großteil der Literatur, die ich studiere, ist es einer dieser Begriffe, die häufig vorkommen, ohne dass eine strenge Definition gefunden werden muss. Insbesondere wird mir gesagt: Für zeitindizierte Zufallsvariablen (RVs) wird das additive Zerlegungsmodell wie folgt angegeben{...

9
Cluster für k-means auswählen: der Fall 1 Cluster

Kennt jemand eine gute Methode, um festzustellen, ob Clustering mit kmeans überhaupt angemessen ist? Was ist, wenn Ihre Probe tatsächlich homogen ist? Ich weiß, dass so etwas wie ein Mischungsmodell (über mclust in R) Anpassungsstatistiken für den 1: k-Clusterfall liefert, aber es scheint, dass...

9
Äquivalenztests für nicht normale Daten?

Ich habe einige Daten, von denen ich nicht unbedingt annehmen kann, dass sie aus Normalverteilungen stammen, und ich möchte Äquivalenztests zwischen Gruppen durchführen. Für normale Daten gibt es Techniken wie TOST (zwei einseitige T-Tests). Gibt es etwas Analoges zu TOST für nicht normale...

9
Macht Stan vorausschauende Posterioren?

Verfügt Stan (insbesondere Rstan) über integrierte Einrichtungen zur Erzeugung prädiktiver posteriorer Verteilungen? Es ist nicht schwer, die Verteilung aus der Stan-Passform zu generieren, aber ich möchte das Rad lieber nicht neu

9
Regression durch den Ursprung

Wir haben die folgenden Punkte: Wie können wir die am besten passende Linie durch die Punkte finden? Mein Rechner hat die Option, die am besten passende Linie durch diese Punkte zu finden, nämlich:y = a x y = a x + b( 0 , 0 ) ( 1 , 51,8 ) ( 1,9 , 101,3 ) ( 2,8 , 148,4 ) ( 3,7 , 201,5 ) ( 4,7 ,...