Als «sampling» getaggte Fragen

10

Gaußsche Verteilung mit Momenten höherer Ordnung

Für die Gauß - Verteilung mit unbekanntem Mittelwert und die Varianz, die ausreichenden Statistiken in dem Standard Exponentialfamilie ist Form . Ich habe eine Verteilung hat , die T ( x ) = ( x , x 2 , . . . , X 2 N

normal-distribution sampling exponential-family

10

einfache Stichprobenmethode für einen Kernel Density Estimator

Ich habe einen einfachen Kernel Density Estimator in Java entwickelt, der auf ein paar Dutzend Punkten (vielleicht bis zu einhundert oder so) und einer Gaußschen Kernelfunktion basiert. Die Implementierung gibt mir zu jedem Zeitpunkt das PDF und CDF meiner Wahrscheinlichkeitsverteilung. Ich möchte...

sampling pdf kde

10

Warum lehnen Hypothesentests für neu abgetastete Datensätze die Null zu oft ab?

tl; dr: Ausgehend von einem unter Null generierten Datensatz habe ich Fälle mit Ersetzung neu abgetastet und einen Hypothesentest für jeden neu abgetasteten Datensatz durchgeführt. Diese Hypothesentests lehnen die Null in mehr als 5% der Fälle ab. In der folgenden sehr einfachen Simulation...

r bootstrap simulation resampling

10

Verhindern, dass Pareto Smoothed Important Sampling (PSIS-LOO) fehlschlägt

Ich habe vor kurzem damit begonnen, die pareto-geglättete Stichprobenauswahl (PSIS-LOO) zu verwenden, die in den folgenden Abhandlungen beschrieben wird: Vehtari, A. & Gelman, A. (2015). Pareto glättete wichtige Stichproben. arXiv Preprint ( Link ). A. Vehtari, A. Gelman & J. Gabry (2016)....

machine-learning cross-validation mcmc pareto-distribution importance-sampling

10

Wie würde sich eine Neugewichtung der Diversity-Daten der American Community Survey auf die Fehlerquote auswirken?

Hintergrund: Meine Organisation vergleicht derzeit ihre Statistiken zur Belegschaftsvielfalt (z. B.% Menschen mit Behinderungen,% Frauen,% Veteranen) mit der Gesamtverfügbarkeit von Arbeitskräften für diese Gruppen auf der Grundlage der American Community Survey (einem Umfrageprojekt des US Census...

confidence-interval sampling data-transformation diversity

10

Sollte ich auf Clusterebene oder auf Einzelebene booten?

Ich habe ein Überlebensmodell mit Patienten, die in Krankenhäusern verschachtelt sind, das einen Zufallseffekt für die Krankenhäuser beinhaltet. Der zufällige Effekt ist gammaverteilt, und ich versuche, die „Relevanz“ dieses Begriffs auf einer leicht verständlichen Skala darzustellen. Ich habe die...

stata bootstrap multilevel-analysis resampling frailty

10

Wie wähle ich die Trainings-, Kreuzvalidierungs- und Testsatzgrößen für kleine Daten mit Stichprobengröße aus?

Angenommen, ich habe eine kleine Stichprobengröße, z. B. N = 100, und zwei Klassen. Wie soll ich die Trainings-, Kreuzvalidierungs- und Testsatzgrößen für maschinelles Lernen auswählen? Ich würde intuitiv auswählen Trainingsset Größe als 50 Kreuzvalidierungssatz Größe 25 und Testgröße als...

machine-learning sampling svm cross-validation sample-size

10

Referenz für eine Geschichte über Stichproben aus dem Telefonbuch

Ich habe heute mit jemandem über Stichproben gesprochen und mich vage an eine Geschichte über einen sehr angesehenen Statistiker erinnert, der in einem bestimmten Rechtsfall eine systematische Stichprobe aus dem Telefonbuch empfohlen hat. Ich erinnere mich, dass die Geschichte so etwas wie ein...

sampling references history

10

Einfacher Beweis von ?

Sei unabhängige normale Standard-Zufallsvariablen. Es gibt viele (langwierige) Beweise, die das zeigenZ1,⋯,ZnZ1,⋯,ZnZ_1,\cdots,Z_n ∑i=1n(Zi−1n∑j=1nZj)2∼χ2n−1∑i=1n(Zi−1n∑j=1nZj)2∼χn−12 \sum_{i=1}^n \left(Z_i - \frac{1}{n}\sum_{j=1}^n Z_j \right)^2 \sim \chi^2_{n-1} Viele Beweise sind ziemlich lang...

mathematical-statistics sampling

9

Gelten Konfidenzintervalle für Quotenstichproben?

Französische Wahlinstitute stehen derzeit vor einer großen Krise, nachdem sie kürzlich eine bislang lächerlichste Umfrage zum Pferderennen der Präsidentschaftswahlen 2012 veröffentlicht haben. Der französische Senat erwägt nun, Gesetze zu diesem Thema zu erlassen, indem er die Wahlinstitute zwingt,...

sampling polling

9

Empfehlen Sie Referenzen zur Gewichtung von Umfragestichproben

Lassen Sie uns einige auf einer Einführungsebene, einige Artikel und einige Lehrbücher anstreben. Applied ist hilfreicher, einschließlich R-Code ist großartig. Vielen

sampling references survey-weights survey-sampling

9

Was ist eine Neigungsgewichtungsprobe / RIM?

Ich bin auf die Stichprobenmethode "Propensity Weighting Sampling / RIM" gestoßen, habe aber keine gute Vorstellung davon, worum es bei diesen Erhebungsmethoden geht. Welche Literaturstellen beziehen sich auf dieses

sampling weighted-sampling

9

Akzeptanzraten für Metropolis-Hastings mit einheitlicher Kandidatenverteilung

Was ist der Grund für eine Akzeptanzrate von etwa 20%, wenn der Metropolis-Hastings-Algorithmus mit einheitlichen Kandidatenverteilungen ausgeführt wird? Mein Gedanke ist: Sobald die wahren (oder nahezu wahren) Parameterwerte entdeckt wurden, würde kein neuer Satz von Kandidatenparameterwerten aus...

bayesian estimation sampling mcmc

9

Wie kann man beobachtete mit erwarteten Ereignissen vergleichen?

Angenommen, ich habe eine Stichprobe von Häufigkeiten von 4 möglichen Ereignissen: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 und ich habe die erwarteten Wahrscheinlichkeiten, dass meine Ereignisse eintreten: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Mit der Summe der beobachteten Häufigkeiten meiner vier...

r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

9

Größe der Bootstrap-Beispiele

Ich lerne Bootstrapping als Mittel zur Schätzung der Varianz einer Stichprobenstatistik. Ich habe einen grundsätzlichen Zweifel. Zitat aus http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Wie viele Beobachtungen sollten wir erneut abtasten? Ein guter Vorschlag ist die...

sampling bootstrap resampling

9

Kann Bootstrap-Resampling verwendet werden, um ein Konfidenzintervall für die Varianz eines Datensatzes zu berechnen?

Ich weiß, dass, wenn Sie mehrmals aus einem Datensatz eine neue Stichprobe erstellen und jedes Mal den Mittelwert berechnen, diese Mittelwerte einer Normalverteilung (durch die CLT) folgen. Auf diese Weise können Sie ein Konfidenzintervall für den Mittelwert des Datensatzes berechnen, ohne Annahmen...

distributions confidence-interval bootstrap resampling

9

Wie macht der Nachweis der Ablehnungsstichprobe Sinn?

Ich nehme an einem Kurs über Monte-Carlo-Methoden teil und wir haben in der letzten Vorlesung die Rejection Sampling-Methode (oder Accept-Reject Sampling-Methode) gelernt. Es gibt viele Ressourcen im Web, die den Beweis dieser Methode zeigen, aber irgendwie bin ich nicht davon überzeugt. In der...

sampling monte-carlo rejection-sampling

9

Überabtastung mit kategorialen Variablen

Ich möchte eine Kombination aus Über- und Unterabtastung durchführen, um meinen Datensatz mit ungefähr 4000 Kunden in zwei Gruppen auszugleichen, wobei eine der Gruppen einen Anteil von ungefähr 15% hat. Ich habe mir SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) und ROSE (...

unbalanced-classes resampling oversampling

9

So probieren Sie, wenn Sie die Verteilung nicht kennen

Ich bin ziemlich neu in der Statistik (eine Handvoll Uni-Kurse für Anfänger) und habe mich über Stichproben aus unbekannten Distributionen gewundert. Wenn Sie keine Ahnung von der zugrunde liegenden Verteilung haben, gibt es eine Möglichkeit, zu "garantieren", dass Sie eine repräsentative...

distributions estimation sampling sample-size algorithms

9

Inverse CDF-Abtastung für eine gemischte Verteilung

Die nicht kontextbezogene Kurzversion Sei eine Zufallsvariable mit CDF yyyF.( ⋅ ) ≡ { θθ + ( 1 - θ ) × CDFlog-normal( ⋅ ; μ , σ) y = 0 y> 0F(⋅)≡{θ y = 0 θ+(1−θ)×CDFlog-normal(⋅;μ,σ) y > 0 F(\cdot) \equiv \cases{\theta & y = 0 \\ \theta + (1-\theta) \times...

r distributions sampling simulation copula