Statistiken und Big Data

10
Statistische Software testen

Welche Techniken / Ansätze sind beim Testen statistischer Software nützlich? Ich interessiere mich besonders für Programme, die parametrische Schätzungen mit maximaler Wahrscheinlichkeit durchführen. Der Vergleich von Ergebnissen mit denen aus anderen Programmen oder veröffentlichten Quellen ist...

10
Metaanalyse in R mit metafor package

Wie soll ich die rmaFunktion aus dem Metafor- Paket syntaxieren , um Ergebnisse im folgenden realen Beispiel einer kleinen Metaanalyse zu erhalten? (Zufallseffekt, zusammenfassende Statistik SMD) study, mean1, sd1, n1, mean2, sd2, n2 Foo2000, 0.78, 0.05, 20, 0.82, 0.07, 25 Sun2003, 0.74, 0.08,...

10
Komplexes Regressionsdiagramm in R.

Ich muss eine komplexe Grafik für die visuelle Datenanalyse zeichnen. Ich habe 2 Variablen und eine große Anzahl von Fällen (> 1000). Zum Beispiel (die Zahl ist 100, wenn die Dispersion weniger "normal" sein soll): x <- rnorm(100,mean=95,sd=50) y <- rnorm(100,mean=35,sd=20) d <-...

10
Probleme mit Dummy-Variablenfallen

Ich führe eine große OLS-Regression durch, bei der alle unabhängigen Variablen (ca. 400) Dummy-Variablen sind. Wenn alle enthalten sind, gibt es eine perfekte Multikollinearität (die Dummy-Variablenfalle), daher muss ich eine der Variablen weglassen, bevor ich die Regression ausführe. Meine erste...

10
Zufallsvektoren mit Einschränkungen erzeugen

Ich muss Zufallsvektoren von reellen Zahlen a_i erstellen, die die folgenden Bedingungen erfüllen: abs(a_i) < c_i; sum(a_i)< A; # sum of elements smaller than A sum(b_i * a_i) < B; # weighted sum is smaller than B aT*A*a < D # quadratic multiplication with A smaller than D where...

10
Wählen Sie die Faktorstufe als Dummy-Basis in lm () in R.

Nehmen wir an, ich regressiere Y auf X1 und X2, wobei X1 eine numerische Variable und X2 ein Faktor mit vier Ebenen (A: D) ist. Gibt es eine Möglichkeit, die lineare Regressionsfunktion lm(Y ~ X1 + as.factor(X2))so zu schreiben , dass ich eine bestimmte Ebene von X2 - beispielsweise B - als...

10
Kombinieren der Wahrscheinlichkeiten von nuklearen Unfällen

Die jüngsten Ereignisse in Japan haben mich über Folgendes nachdenken lassen. Kernkraftwerke sind normalerweise so ausgelegt, dass das Risiko schwerer Unfälle auf eine „Entwurfsgrundwahrscheinlichkeit“ begrenzt wird, z. B. 10E-6 / Jahr. Dies ist das Kriterium für eine einzelne Anlage. Wie...

10
Parallelisierung des Caret-Pakets mit doSMP

UPDATE: Caret wird jetzt foreachintern verwendet, sodass diese Frage nicht mehr wirklich relevant ist. Wenn Sie ein funktionierendes paralleles Backend für registrieren können foreach, wird es von Caret verwendet. Ich habe das Caret- Paket für R und bin daran interessiert, die trainFunktion zur...