Statistiken und Big Data

8
Sollten wir kontinuierliche Variablen ablegen?

Ich weiß, dass dies bereits gefragt wurde, und ich habe die Antworten auf die früheren Fragen zum Binning kontinuierlicher Variablen gelesen. Ich verstehe, dass wir generell das Binning vermeiden sollten, da dies möglicherweise dazu führt, dass nützliche Informationen (unter anderem) weggeworfen...

8
Faire Münztests

Dies mag ein sehr bekanntes Problem sein, aber ich bin mir nicht sicher, welche Methoden dafür gut wären. Nehmen wir an, jemand bittet uns, 20 Mal eine Münze zu werfen, um zu prüfen, ob es sich um eine faire Münze handelt. Dies ist eine ziemlich einfache Aufgabe. Wir könnten leicht Hypothesentests...

8
Elemente statistischer Lernalternativen

Elements of Statistical Learning (ESL) ist ein Buch mit einer fantastischen Breite und Tiefe. Es behandelt das Wesentliche der sehr modernen Methoden, indem es die Arbeiten zitiert, in denen diese ursprünglichen Studien entstanden sind. Ich finde die Sprache des Buches jedoch wirklich sehr, sehr...

8
Hat die Binomialverteilung die kleinstmögliche Varianz unter allen „vernünftigen“ Verteilungen, die binäre Wahlen modellieren können?

Stellen Sie sich eine Wahl vor, bei der Personen eine binäre Wahl treffen: Sie stimmen für A oder dagegen. Das Ergebnis ist, dass m Menschen für A stimmen, und daher ist das Ergebnis von A p = m / n .nnnmmmp=m/np=m/np=m/n Wenn ich diese Wahlen modellieren möchte, kann ich davon ausgehen, dass jede...

8
Genaue Definition von Maxout

Ich habe versucht herauszufinden, was genau es mit der Aktivierungsfunktion "Maxout" in neuronalen Netzen bedeutet. Es gibt diese Frage, dieses Papier und sogar das Deep Learning-Buch von Bengio et al. , außer mit nur ein paar Informationen und einem großen TODO daneben. Ich werde die hier...

8
Wie berechnet man den p.-Wert eines Odds Ratio in R?

Ich habe folgende Wertetabelle: 25 75 38 162 Das Odds Ratio beträgt 0,7037 und log (OR) beträgt -0,3514. Für eine Kontingenztabelle mit den Werten a, b, c und d ist die Varianz von log (OR) gegeben durch (1/a + 1/b + 1/c + 1/d) Wie kann ich den p.-Wert von log (OR) aus diesen Daten in R...