Statistiken und Big Data

10
Markowitz-Portfolio mittlere Varianzoptimierung in R.

Ich habe 5 Schwellenmarkt-Gesamtrendite-Serien für Schwellenländer, für die ich zukünftige Renditen für einen Zeitraum (1 Jahr) prognostiziere. Ich möchte ein für die Markowitz-Mittelwertvarianz optimiertes Portfolio der 5er-Serie unter Verwendung historischer Varianzen und Kovarianzen (1) und...

10
Beste Möglichkeit, mit einer R-Sitzung in der Cloud zu interagieren

Gesperrt . Diese Frage und ihre Antworten sind gesperrt, da die Frage nicht zum Thema gehört, aber historische Bedeutung hat. Derzeit werden keine neuen Antworten oder Interaktionen akzeptiert. Ich habe R auf Amazon EC2 mit einer modifizierten Version des Bioconductor...

10
Gibt an, ob ein Offset in einer Poisson-Regression verwendet werden soll, wenn die von Hockeyspielern erzielten Karriereziele insgesamt prognostiziert werden

Ich habe eine Frage, ob ich einen Offset verwenden soll oder nicht. Nehmen Sie ein sehr einfaches Modell an, in dem Sie die (Gesamt-) Anzahl der Tore im Hockey beschreiben möchten. Sie haben also Tore, die Anzahl der gespielten Spiele und eine Dummy-Variable "Stürmer", die gleich 1 ist, wenn der...

10
Gründe für die Verwendung von AUC?

Insbesondere auf der computerwissenschaftlich orientierten Seite der Literatur zum maschinellen Lernen ist die AUC (Fläche unter der Kennlinie des Empfängeroperators) ein beliebtes Kriterium für die Bewertung von Klassifikatoren. Was sind die Gründe für die Verwendung der AUC? Gibt es...

10
Was ist der Unterschied zwischen ITT und ATE?

Ich habe Probleme, die verschiedenen Schätzer zu verstehen, die für eine Folgenabschätzung verwendet werden können. Ich weiß, dass der Intention-to-Treat-Schätzer (ITT) Unterschiede zwischen berechtigten Personen ohne das Programm und berechtigten Personen mit dem Programm vergleicht, unabhängig...

10
So schätzen Sie Parameter für einen Kalman-Filter

In einer früheren Frage habe ich nach der Anpassung von Verteilungen an einige nicht-Gaußsche empirische Daten gefragt. Es wurde mir offline vorgeschlagen, die Annahme zu versuchen, dass die Daten Gauß'sch sind, und zuerst einen Kalman-Filter anzupassen. Entscheiden Sie dann abhängig von den...

10
Randomisierte Trace-Technik

Ich habe die folgende randomisierte Trace-Technik in M. Seeger kennengelernt : „Aktualisierungen mit niedrigem Rang für die Cholesky-Zerlegung“, University of California in Berkeley, Tech. Rep, 2007. tr(A)=E[xTAx]tr⁡(A)=E[xTAx]\operatorname{tr}(\mathbf{A}) = {E[\mathbf{x}^T \mathbf{A}...

10
Gutes Buch über den theoretischen Ansatz zur Statistik

Als ich vor 10 Jahren als Student Kurse in theoretischer Statistik belegte, verwendeten wir Modern Mathematical Statistics von Dudewicz und Mishra. Ich beziehe mich jetzt auf das Buch und werde daran erinnert, dass einige der Codebeispiele für eine IBM 370 in Montage sind. Ich bin zwar urig, aber...

10
Warum geben Demografen Raten pro 100.000 Menschen an?

Es scheint universell, dass demografische Statistiken in Bezug auf 100.000 Einwohner pro Jahr angegeben werden. Zum Beispiel Selbstmordraten, Mordraten, behinderungsbereinigtes Lebensjahr, die Liste geht weiter. Warum? Wenn wir über Chemie sprechen, sind Teile pro Million (ppm) üblich. Warum wird...