Statistiken und Big Data

15
Kostenloses öffentliches Datenhosting? [geschlossen]

Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so, dass sie zum Thema passt für Kreuz Validated. Geschlossen vor 4 Jahren . Ich habe stündliche und...

15
Logistische Regression mit niedriger Ereignisrate anwenden

Ich habe einen Datensatz, in dem die Ereignisrate sehr niedrig ist (40.000 von 12⋅10512⋅10512\cdot10^5 ). Ich wende hier eine logistische Regression an. Ich hatte eine Diskussion mit jemandem, bei der sich herausstellte, dass eine logistische Regression keine gute Verwirrungsmatrix für solche Daten...

15
So berechnen Sie die Varianz einer Variablenpartition

Ich führe ein Experiment durch, bei dem ich (unabhängige) Samples parallel sammle, ich berechne die Varianz jeder Gruppe von Samples und jetzt möchte ich dann alle kombinieren, um die Gesamtvarianz aller Samples zu finden. Es fällt mir schwer, eine Ableitung dafür zu finden, da ich mir der...

15
Optimale Elfmeterauswahl für Lasso

Gibt es analytische Ergebnisse oder experimentelle Arbeiten zur optimalen Wahl des Koeffizienten für den Strafzeitpunkt ? ℓ1ℓ1\ell_1Mit optimal meine ich einen Parameter, der die Wahrscheinlichkeit der Auswahl des besten Modells maximiert oder den erwarteten Verlust minimiert. Ich frage, weil es...

15
So verwenden Sie keine Statistiken

Dies ist eine Art offene Frage, aber ich möchte klar sein. Bei einer ausreichenden Bevölkerungszahl können Sie möglicherweise etwas lernen (dies ist der offene Teil), aber was auch immer Sie über Ihre Bevölkerungszahl erfahren, wann ist dies jemals auf ein Mitglied der Bevölkerung...

15
Wie funktioniert die Quantilnormalisierung?

In Genexpressionsstudien mit Microarrays müssen Intensitätsdaten normalisiert werden, damit Intensitäten zwischen Individuen und Genen verglichen werden können. Konzeptionell und algorithmisch funktioniert die "Quantil-Normalisierung" und wie würden Sie dies einem Nicht-Statistiker...

15
Gibt es mehr als Bayesianismus?

Als Student der Physik habe ich die Vorlesung "Warum ich ein Bayesianer bin" vielleicht ein halbes Dutzend Mal erlebt. Es ist immer dasselbe - der Moderator erklärt selbstgefällig, dass die Bayes'sche Interpretation der von den Massen angeblich verwendeten frequentistischen Interpretation überlegen...

15
Normalisierungskonstante im Bayes-Theorem

Pr(data)Pr(data)\Pr(\textrm{data}) Pr(parameters∣data)=Pr(data∣parameters)Pr(parameters)Pr(data)Pr(parameters∣data)=Pr(data∣parameters)Pr(parameters)Pr(data)\Pr(\text{parameters} \mid \text{data}) = \frac{\Pr(\textrm{data} \mid \textrm{parameters}) \Pr(\text{parameters})}{\Pr(\text{data})} wird...