Statistiken und Big Data

36
Was ist eine Instrumentalvariable?

In der angewandten Wirtschaft und Statistik werden instrumentelle Variablen immer häufiger. Können wir für die Uneingeweihten einige nichttechnische Antworten auf die folgenden Fragen haben: Was ist eine Instrumentalvariable? Wann würde man eine instrumentelle Variable einsetzen wollen? Wie findet...

36
Zeitfunktionen in R [geschlossen]

Ich möchte die Zeit messen, die benötigt wird, um die Ausführung einer Funktion zu wiederholen. Sind replicate()und benutzen for-Schleifen gleichwertig? Beispielsweise: system.time(replicate(1000, f())); system.time(for(i in 1:1000){f()}); Welches ist die bevorzugte Methode. In der Ausgabe von...

36
Wie kann man quasi zwei Vektoren von Strings (in R) zuordnen?

Ich bin mir nicht sicher, wie dies bezeichnet werden soll. Bitte korrigieren Sie mich, wenn Sie einen besseren Begriff kennen. Ich habe zwei Listen. Eines von 55 Elementen (z. B. ein Vektor von Zeichenfolgen), das andere von 92. Die Elementnamen sind ähnlich, aber nicht identisch. Ich wünsche den...

36
Wie wird mit einer herkömmlichen Programmiersprache aus einer Normalverteilung mit bekanntem Mittelwert und bekannter Varianz eine Stichprobe erstellt?

Ich hatte noch nie einen Statistikkurs und hoffe, dass ich hier an der richtigen Stelle nachfragen kann. Angenommen, ich habe nur zwei Daten, die eine Normalverteilung beschreiben: den Mittelwert μμ\mu und die Varianz σ2σ2\sigma^2 . Ich möchte einen Computer verwenden, um zufällig eine Stichprobe...

36
Maßnahme im Data Mining aufheben

Ich habe viele Websites durchsucht, um zu wissen, was Lift genau bewirkt. Die Ergebnisse, die ich gefunden habe, handelten von der Verwendung in Anwendungen, die sich nicht von selbst unterscheiden. Ich kenne die Unterstützungs- und Vertrauensfunktion. Laut Wikipedia ist Lift beim Data Mining ein...

36
Experimentelle Beweise für Visualisierungen im Tufte-Stil?

F: Gibt es experimentelle Beweise für minimalistische Visualisierungen im Tufte-Stil, die Daten sprechen, und nicht für Visualisierungen von beispielsweise Nigel Holmes ? Ich fragte, wie ich den R-Plots hier Chart-Junk hinzufügen könne , und die Responder warfen mir eine kräftige Menge Snark zu. Es...

36
Woher kommt

Eine sehr einfache Version des zentralen begrenzten Theorems wie n−−√((1n∑i=1nXi)−μ) →d N(0,σ2)n((1n∑i=1nXi)−μ) →d N(0,σ2) \sqrt{n}\bigg(\bigg(\frac{1}{n}\sum_{i=1}^n X_i\bigg) - \mu\bigg)\ \xrightarrow{d}\ \mathcal{N}(0,\;\sigma^2) ist Lindeberg-Lévy CLT. Ich verstehe nicht, warum es...