Statistiken und Big Data

10
Wenn

Lassen und  unabhängige Ereignisse, und sei  und unabhängige Ereignisse sein. Wie zeige ich, dass  und auch unabhängige Ereignisse sind?AAABBBAAACCCAAAB∪CB∪CB\cup C Nach der Definition unabhängiger Ereignisse sind  und genau dann unabhängig, wennAAAB∪CB∪CB\cup

10
Variational Bayes kombiniert mit Monte Carlo

Ich lese über Variations-Bayes nach, und so wie ich es verstehe, kommt es auf die Idee an, dass Sie approximieren (wobei die latenten Variablen Ihres Modells undp ( z∣ x )p(z∣x)p(z\mid x)zzzxxx die beobachteten Daten sind) mit einer Funktion approximieren , wobei angenommen wird, dass q als q i ( z...

10
Reicht es bei der Neuparametrierung einer Wahrscheinlichkeitsfunktion aus, nur die transformierte Variable anstelle einer Änderung der Variablenformel einzufügen?

Angenommen, ich versuche, eine Wahrscheinlichkeitsfunktion, die exponentiell verteilt ist, neu zu parametrisieren. Wenn meine ursprüngliche Wahrscheinlichkeitsfunktion lautet: p(y∣θ)=θe−θyp(y∣θ)=θe−θy p(y \mid \theta) = \theta e^{-\theta y} und ich möchte es mit neu parametrisieren , da keine...

10
Überanpassung mit linearen Klassifikatoren

Heute erklärte unser Professor in der Klasse, dass "eine Überanpassung mit linearen Klassifikatoren nicht möglich ist". Ich halte das für falsch, da selbst lineare Klassifizierer empfindlich auf Ausreißer im Trainingssatz reagieren können - zum Beispiel eine Support Vector Machine mit hartem Rand:...

10
Verwendung des Medians zur Berechnung der Varianz

Ich habe eine 1-D-Zufallsvariable, die extrem verzerrt ist. Um diese Verteilung zu normalisieren, möchte ich eher den Median als den Mittelwert verwenden. Meine Frage lautet: Kann ich die Varianz der Verteilung anhand des Medians in der Formel anstelle des Mittelwerts berechnen? dh kann ich...

10
Wie lese ich p, d und q von auto.arima ()?

Wie kann ich p,d and qWerte im ARIMA(p,d,q)Modell erhalten, die von geschätzt werden auto.arima(mytimeseries)? arima_model <- auto.arima (mytimeseries, ic = 'bic') Wenn wir uns die Ausgabe von ansehen arima_model $ arma wir bekommen, [1] 1 0 0 0 1 2 0 Welche Bedeutung haben die...

10
Mit welchen statistischen Methoden kann ich beliebte oder häufig verwendete Kombinationen kategorialer Variablen finden?

Ich mache eine Studie über den Gebrauch von Polydrogen. Ich habe einen Datensatz von 400 Drogenabhängigen, die jeweils die Drogen angegeben haben, die sie missbrauchen. Es gibt mehr als 10 Medikamente und daher große mögliche Kombinationen. Ich habe die meisten Drogen, die sie konsumieren, in...

10
Was genau bedeutet

Was bedeutet Notation (Punkt über Tilde) bedeutet, in dem Zusammenhang wie x ˙ ~ N ( 0 , 1 ) ?∼˙∼˙\dot\simx∼˙N(0,1)x∼˙N(0,1)x \mathrel{\dot\sim} \mathcal N(0,1) Es stellt sich heraus, dass es einfacher ist, den richtigen Satz zu finden: tex.SE erklärt, dass man tippen sollte,...