Statistiken und Big Data

37
Validierungsübergreifende Zeitreihenanalyse

Ich habe das Caret-Paket in R verwendet, um Vorhersagemodelle für Klassifizierung und Regression zu erstellen. Caret bietet eine einheitliche Oberfläche, um Modell-Hyperparameter durch Cross-Validierung oder Boot-Strapping zu optimieren. Wenn Sie beispielsweise ein einfaches Modell für die...

37
Was sind die nützlichsten Quellen für Wirtschaftsdaten?

Wenn man in der Wirtschaft forscht, muss man häufig theoretische Schlussfolgerungen zu realen Daten überprüfen. Was sind zuverlässige Datenquellen, die zu verwenden und zu zitieren sind? Ich interessiere mich hauptsächlich für Quellen, die verschiedene statistische Daten wie BIP, Bevölkerung, VPI,...

37
SVM, Überanpassung, Fluch der Dimensionalität

Mein Datensatz ist klein (120 Samples), die Anzahl der Features variiert jedoch von (1000-200.000). Obwohl ich eine Feature-Auswahl vornehme, um eine Untergruppe von Features auszuwählen, ist diese möglicherweise immer noch zu groß. Meine erste Frage ist, wie SVM mit Überanpassung umgeht, wenn...