Statistiken und Big Data

25
Ist PCA unter Multikollinearität instabil?

Ich weiß, dass in einer Regressionssituation, wenn Sie eine Reihe von stark korrelierten Variablen haben, dies normalerweise "schlecht" ist, weil die geschätzten Koeffizienten instabil sind (Varianz geht gegen Unendlich, Determinante gegen Null). Meine Frage ist, ob diese "Bösartigkeit" in einer...

25
Anzahl der Merkmale im Vergleich zur Anzahl der Beobachtungen

Gibt es irgendwelche Papiere / Bücher / Ideen über die Beziehung zwischen der Anzahl der Merkmale und der Anzahl der Beobachtungen, die man benötigt, um einen "robusten" Klassifikator zu trainieren? Angenommen, ich habe 1000 Features und 10 Beobachtungen aus zwei Klassen als Trainingssatz und 10...

25
Behandlung der Modellunsicherheit

Ich habe mich gefragt, wie die Bayesianer in der CrossValidated-Community das Problem der Modellunsicherheit sehen und wie sie es vorziehen, damit umzugehen. Ich werde versuchen, meine Frage in zwei Teilen zu stellen: Wie wichtig ist (Ihrer Erfahrung / Meinung nach) der Umgang mit...

25
Schätzung des gleichen Modells über mehrere Zeitreihen

Ich habe einen unerfahrenen Hintergrund in Zeitreihen (einige ARIMA-Schätzungen / Prognosen) und stehe vor einem Problem, das ich nicht vollständig verstehe. Jede Hilfe wäre sehr dankbar. Ich analysiere mehrere Zeitreihen, alle über das gleiche Zeitintervall und alle mit der gleichen Häufigkeit,...

25
Wie misst man die Glätte einer Zeitreihe in R?

Gibt es eine gute Möglichkeit, die Glätte einer Zeitreihe in R zu messen? Beispielsweise, -1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0 ist viel glatter als -1, 0.8, -0.6, 0.4, -0.2, 0, 0.2, -0.4, 0.6, -0.8, 1.0 obwohl sie den gleichen Mittelwert und die gleiche Standardabweichung haben....