Statistiken und Big Data

16
tanh vs. sigmoid im neuronalen Netz

Ich entschuldige mich im Voraus für die Tatsache, dass ich immer noch auf dem Laufenden bin. Ich versuche die Vor- und Nachteile der Verwendung von tanh (Karte -1 bis 1) vs. sigmoid (Karte 0 bis 1) für meine Neuronenaktivierungsfunktion zu verstehen. Nach meiner Lektüre klang es wie eine...

16
Was genau ist eine Distribution?

Ich weiß sehr wenig über Wahrscheinlichkeit und Statistik und möchte lernen. Ich sehe das Wort "Verteilung", das überall in verschiedenen Zusammenhängen verwendet wird. Beispielsweise hat eine diskrete Zufallsvariable eine "Wahrscheinlichkeitsverteilung". Ich weiß was das ist. Eine stetige...

16
Warum brauchen wir Bootstrapping?

Ich lese gerade Larry Wassermans "All of Statistics" und wundere mich über etwas, das er in dem Kapitel über das Schätzen statistischer Funktionen nichtparametrischer Modelle geschrieben hat. Er schrieb "Manchmal können wir den geschätzten Standardfehler einer statistischen Funktion durch einige...

16
R-Paket für Weighted Random Forest? Klassewt Option?

Ich versuche, Random Forest zu verwenden, um das Ergebnis eines extrem unausgeglichenen Datensatzes vorherzusagen (die Minderheitsklassenrate beträgt nur etwa 1% oder sogar weniger). Da der herkömmliche Random Forest-Algorithmus die Gesamtfehlerrate minimiert, anstatt den Minderheitsklassen...

16
Missverständnis eines P-Wertes?

Ich habe viel darüber gelesen, wie man einen P-Wert richtig interpretiert, und nach allem, was ich gelesen habe, sagt der p-Wert NICHTS über die Wahrscheinlichkeit aus, dass die Nullhypothese wahr oder falsch ist. Beim Lesen der folgenden Anweisung: Der p - Wert repräsentiert die...