Für die Gauß - Verteilung mit unbekanntem Mittelwert und die Varianz, die ausreichenden Statistiken in dem Standard Exponentialfamilie ist Form . Ich habe eine Verteilung hat , die T ( x ) = ( x , x 2 , . . . , X 2 N
Für die Gauß - Verteilung mit unbekanntem Mittelwert und die Varianz, die ausreichenden Statistiken in dem Standard Exponentialfamilie ist Form . Ich habe eine Verteilung hat , die T ( x ) = ( x , x 2 , . . . , X 2 N
Ich habe einen einfachen Kernel Density Estimator in Java entwickelt, der auf ein paar Dutzend Punkten (vielleicht bis zu einhundert oder so) und einer Gaußschen Kernelfunktion basiert. Die Implementierung gibt mir zu jedem Zeitpunkt das PDF und CDF meiner Wahrscheinlichkeitsverteilung. Ich möchte...
tl; dr: Ausgehend von einem unter Null generierten Datensatz habe ich Fälle mit Ersetzung neu abgetastet und einen Hypothesentest für jeden neu abgetasteten Datensatz durchgeführt. Diese Hypothesentests lehnen die Null in mehr als 5% der Fälle ab. In der folgenden sehr einfachen Simulation...
Ich habe vor kurzem damit begonnen, die pareto-geglättete Stichprobenauswahl (PSIS-LOO) zu verwenden, die in den folgenden Abhandlungen beschrieben wird: Vehtari, A. & Gelman, A. (2015). Pareto glättete wichtige Stichproben. arXiv Preprint ( Link ). A. Vehtari, A. Gelman & J. Gabry (2016)....
Hintergrund: Meine Organisation vergleicht derzeit ihre Statistiken zur Belegschaftsvielfalt (z. B.% Menschen mit Behinderungen,% Frauen,% Veteranen) mit der Gesamtverfügbarkeit von Arbeitskräften für diese Gruppen auf der Grundlage der American Community Survey (einem Umfrageprojekt des US Census...
Ich habe ein Überlebensmodell mit Patienten, die in Krankenhäusern verschachtelt sind, das einen Zufallseffekt für die Krankenhäuser beinhaltet. Der zufällige Effekt ist gammaverteilt, und ich versuche, die „Relevanz“ dieses Begriffs auf einer leicht verständlichen Skala darzustellen. Ich habe die...
Angenommen, ich habe eine kleine Stichprobengröße, z. B. N = 100, und zwei Klassen. Wie soll ich die Trainings-, Kreuzvalidierungs- und Testsatzgrößen für maschinelles Lernen auswählen? Ich würde intuitiv auswählen Trainingsset Größe als 50 Kreuzvalidierungssatz Größe 25 und Testgröße als...
Ich habe heute mit jemandem über Stichproben gesprochen und mich vage an eine Geschichte über einen sehr angesehenen Statistiker erinnert, der in einem bestimmten Rechtsfall eine systematische Stichprobe aus dem Telefonbuch empfohlen hat. Ich erinnere mich, dass die Geschichte so etwas wie ein...
Sei unabhängige normale Standard-Zufallsvariablen. Es gibt viele (langwierige) Beweise, die das zeigenZ1,⋯,ZnZ1,⋯,ZnZ_1,\cdots,Z_n ∑i=1n(Zi−1n∑j=1nZj)2∼χ2n−1∑i=1n(Zi−1n∑j=1nZj)2∼χn−12 \sum_{i=1}^n \left(Z_i - \frac{1}{n}\sum_{j=1}^n Z_j \right)^2 \sim \chi^2_{n-1} Viele Beweise sind ziemlich lang...
Französische Wahlinstitute stehen derzeit vor einer großen Krise, nachdem sie kürzlich eine bislang lächerlichste Umfrage zum Pferderennen der Präsidentschaftswahlen 2012 veröffentlicht haben. Der französische Senat erwägt nun, Gesetze zu diesem Thema zu erlassen, indem er die Wahlinstitute zwingt,...
Lassen Sie uns einige auf einer Einführungsebene, einige Artikel und einige Lehrbücher anstreben. Applied ist hilfreicher, einschließlich R-Code ist großartig. Vielen
Ich bin auf die Stichprobenmethode "Propensity Weighting Sampling / RIM" gestoßen, habe aber keine gute Vorstellung davon, worum es bei diesen Erhebungsmethoden geht. Welche Literaturstellen beziehen sich auf dieses
Was ist der Grund für eine Akzeptanzrate von etwa 20%, wenn der Metropolis-Hastings-Algorithmus mit einheitlichen Kandidatenverteilungen ausgeführt wird? Mein Gedanke ist: Sobald die wahren (oder nahezu wahren) Parameterwerte entdeckt wurden, würde kein neuer Satz von Kandidatenparameterwerten aus...
Angenommen, ich habe eine Stichprobe von Häufigkeiten von 4 möglichen Ereignissen: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 und ich habe die erwarteten Wahrscheinlichkeiten, dass meine Ereignisse eintreten: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Mit der Summe der beobachteten Häufigkeiten meiner vier...
Ich lerne Bootstrapping als Mittel zur Schätzung der Varianz einer Stichprobenstatistik. Ich habe einen grundsätzlichen Zweifel. Zitat aus http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Wie viele Beobachtungen sollten wir erneut abtasten? Ein guter Vorschlag ist die...
Ich weiß, dass, wenn Sie mehrmals aus einem Datensatz eine neue Stichprobe erstellen und jedes Mal den Mittelwert berechnen, diese Mittelwerte einer Normalverteilung (durch die CLT) folgen. Auf diese Weise können Sie ein Konfidenzintervall für den Mittelwert des Datensatzes berechnen, ohne Annahmen...
Ich nehme an einem Kurs über Monte-Carlo-Methoden teil und wir haben in der letzten Vorlesung die Rejection Sampling-Methode (oder Accept-Reject Sampling-Methode) gelernt. Es gibt viele Ressourcen im Web, die den Beweis dieser Methode zeigen, aber irgendwie bin ich nicht davon überzeugt. In der...
Ich möchte eine Kombination aus Über- und Unterabtastung durchführen, um meinen Datensatz mit ungefähr 4000 Kunden in zwei Gruppen auszugleichen, wobei eine der Gruppen einen Anteil von ungefähr 15% hat. Ich habe mir SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) und ROSE (...
Ich bin ziemlich neu in der Statistik (eine Handvoll Uni-Kurse für Anfänger) und habe mich über Stichproben aus unbekannten Distributionen gewundert. Wenn Sie keine Ahnung von der zugrunde liegenden Verteilung haben, gibt es eine Möglichkeit, zu "garantieren", dass Sie eine repräsentative...
Die nicht kontextbezogene Kurzversion Sei eine Zufallsvariable mit CDF yyyF.( ⋅ ) ≡ { θθ + ( 1 - θ ) × CDFlog-normal( ⋅ ; μ , σ) y = 0 y> 0F(⋅)≡{θ y = 0 θ+(1−θ)×CDFlog-normal(⋅;μ,σ) y > 0 F(\cdot) \equiv \cases{\theta & y = 0 \\ \theta + (1-\theta) \times...