Statistiken und Big Data

12
Restanalyse der logistischen Regression

Diese Frage ist allgemein und langwierig, aber bitte nehmen Sie Kontakt mit mir auf. In meiner Anwendung habe ich viele Datensätze, die jeweils aus ~ 20.000 Datenpunkten mit ~ 50 Features und einer einzelnen abhängigen Binärvariablen bestehen. Ich versuche, die Datensätze mithilfe einer regulierten...

12
Was ist eine Bias-Korrektur? [geschlossen]

Geschlossen . Diese Frage erfordert Details oder Klarheit . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Fügen Sie Details hinzu und klären Sie das Problem, indem Sie diesen Beitrag bearbeiten . Geschlossen vor 4 Jahren ....

12
Was sind

Ich habe in letzter Zeit viele Artikel über spärliche Darstellungen gesehen, und die meisten von ihnen verwenden die ℓpℓp\ell_p Norm und führen einige Minimierungen durch. Meine Frage ist, was ist die ℓpℓp\ell_p Norm und die ℓp,qℓp,q\ell_{p, q} Mischnorm? Und wie sind sie für die Regularisierung...

12
Wie kann die Anzahl der Elemente mithilfe der Faktorenanalyse, der internen Konsistenz und der Elementantworttheorie in Verbindung reduziert werden?

Ich bin gerade dabei, einen Fragebogen empirisch zu entwickeln, und werde in diesem Beispiel beliebige Zahlen verwenden, um dies zu veranschaulichen. Für den Kontext entwickle ich einen psychologischen Fragebogen, der darauf abzielt, Gedankenmuster zu bewerten, die häufig bei Menschen mit...

12
Differenzzeitreihen vor Arima oder innerhalb von Arima

Ist es besser, eine Reihe zu unterscheiden (vorausgesetzt, sie wird benötigt), bevor ein Arima verwendet wird, ODER besser, den Parameter d in Arima zu verwenden? Ich war überrascht, wie unterschiedlich die angepassten Werte sind, je nachdem, welche Route mit demselben Modell und denselben Daten...

12
PCA und zufällige Wälder

Für einen kürzlich durchgeführten Kaggle-Wettbewerb habe ich (manuell) 10 zusätzliche Funktionen für mein Trainingsset definiert, die dann zum Trainieren eines zufälligen Waldklassifikators verwendet werden. Ich habe mich entschieden, PCA für das Dataset mit den neuen Funktionen auszuführen, um zu...

12
Behrens-Fisher-Problem

Gibt es einen guten veröffentlichten Expository-Bericht mit mathematischen Details zu den verschiedenen Ansätzen, die für das Behrens-Fisher-Problem verwendet

12
SVD einer Matrix mit fehlenden Werten

Angenommen, ich habe eine Empfehlungsmatrix im Netflix-Stil und möchte ein Modell erstellen, das potenzielle zukünftige Filmbewertungen für einen bestimmten Benutzer vorhersagt. Mit dem Ansatz von Simon Funk würde man eine stochastische Gradientenabsenkung verwenden, um die Frobenius-Norm zwischen...

12
Hierarchische Bayes'sche Modelle vs. empirische Bayes

Würden Sie das HBM vs EB als zwei Alternativen betrachten, bei denen die Hyperparameter "im Spiel" sind, abgetastet / geschätzt / etc. Zu werden? Es besteht eindeutig ein Zusammenhang zwischen diesen beiden. Würden Sie HBM als "voll Bayesianer" betrachten als EB? Gibt es einen Ort, an dem ich sehen...