Statistiken und Big Data

10
Gigantische Kurtosis?

Ich mache einige beschreibende Statistiken über die täglichen Renditen von Aktienindizes. Das heißt, wenn und die an Tag 1 bzw. Tag 2 sind, dann ist die Rendite, die ich verwende (in der Literatur völlig Standard).P1P1P_1P2P2P_2loge(P2P1)loge(P2P1)log_e (\frac{P_2}{P_1}) In einigen Fällen ist die...

10
Kann ein Modell von P (Y | X) durch stochastischen Gradientenabstieg von nicht-iid-Proben von P (X) und iid-Proben von P (Y | X) trainiert werden?

Beim Trainieren eines parametrisierten Modells (z. B. zur Maximierung der Wahrscheinlichkeit) über einen stochastischen Gradientenabstieg in einem Datensatz wird üblicherweise angenommen, dass die Trainingsmuster aus der Trainingsdatenverteilung entnommen werden. Wenn das Ziel darin besteht, eine...

10
randomForest und variabler Wichtigkeitsfehler?

Ich verstehe den Unterschied zwischen rfobject$importanceund importance(rfobject)in der Spalte MeanDecreaseAccuracy nicht. Beispiel: > data("iris") > fit <- randomForest(Species~., data=iris, importance=TRUE) > fit$importance setosa versicolor virginica MeanDecreaseAccuracy...