Statistiken und Big Data

11
Wie ist

Angenommen, YYY ist eine kontinuierliche Zufallsvariable und XXX ist eine diskrete. Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y)Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y) \Pr(X=x|Y=y) = \frac{\Pr(X=x)\Pr(Y=y|X=x)}{\Pr(Y=y)} Wie wir wissen, ist Pr(Y=y)=0Pr(Y=y)=0\Pr(Y=y) = 0 weil YYY eine kontinuierliche...

11
Überwachtes Lernen mit unsicheren Daten?

Gibt es eine Methode zur Anwendung eines überwachten Lernmodells auf einen unsicheren Datensatz? Angenommen, wir haben einen Datensatz mit den Klassen A und B: +----------+----------+-------+-----------+ | FeatureA | FeatureB | Label | Certainty | +----------+----------+-------+-----------+ | 2 | 3...

11
Wenn die Schrumpfung auf clevere Weise angewendet wird, funktioniert sie für effizientere Schätzer immer besser?

Angenommen , ich habe zwei Schätzern ß 1 und β 2 , die konsistente Schätzer des gleichen Parameters β 0 und so , dass √βˆ1β^1\widehat{\beta}_1βˆ2β^2\widehat{\beta}_2β0β0\beta_0n−−√(βˆ1−β0)→dN(0,V1),n−−√(βˆ2−β0)→dN(0,V2)n(β^1−β0)→dN(0,V1),n(β^2−β0)→dN(0,V2)\sqrt{n}(\widehat{\beta}_1 -\beta_0)...

11
Generalisierungsgrenzen für SVM

Ich interessiere mich für theoretische Ergebnisse für die Verallgemeinerungsfähigkeit von Support Vector Machines, z. B. Grenzen der Wahrscheinlichkeit von Klassifizierungsfehlern und der Vapnik-Chervonenkis (VC) -Dimension dieser Maschinen. Beim Lesen der Literatur hatte ich jedoch den Eindruck,...

11
RMSE vs Standardabweichung in der Bevölkerung

RMSE (Root Mean Square Error) und SD (Standardabweichung) haben ähnliche Formeln. Dieser Link sagt Der einzige Unterschied besteht darin, dass Sie durch und nicht durch dividieren, da Sie hier den Stichprobenmittelwert nicht subtrahieren. Der RMSE würde dann \ sigma entsprechen . Daher ist der...