Statistiken und Big Data

10
Bestimmen von Parametern (p, d, q) für die ARIMA-Modellierung

Ich bin ziemlich neu in der Statistik und R. Ich würde gerne wissen, wie die ARIMA-Parameter für meinen Datensatz ermittelt werden. Können Sie mir helfen, dasselbe mit R und theoretisch (wenn möglich) herauszufinden? Die Daten reichen vom 12. Januar bis 14. März und zeigen die monatlichen Verkäufe....

10
Verzögerungsreihenfolge für den Granger-Kausaltest

Angenommen, ich erwäge mehrere unabhängige Variablen für eine mögliche Aufnahme in ein von mir entwickeltes ARIMAX-Modell. Bevor ich verschiedene Variablen anpasse, möchte ich Variablen, die eine umgekehrte Kausalität aufweisen, mithilfe eines Granger-Tests herausfiltern (ich verwende die...

10
Wie vergleiche ich den Unterschied zwischen zwei Zeitreihen?

Ich arbeite an meiner Diplomarbeit, in der ich untersuche, wie stark Menschen bei verschiedenen Ereignissen Emotionen zeigen. Mein Problem ist (1), dass ich SEHR wenig Erfahrung mit Statistik und Mathematik habe, daher bin ich mit allen verschiedenen Methoden irgendwie verloren und würde mich sehr...

10
Interpretation der CCF-Korrelation in R.

Ich benutze ccf, um eine Korrelation zwischen 2 Zeitreihen zu finden. Ich bekomme eine Handlung, die so aussieht: Beachten Sie, dass ich hauptsächlich an der Korrelation für die Verzögerung = 0 interessiert bin. Fragen: Interpretieren Sie es richtig, dass es eine Kreuzkorrelation für die...

10
Caret varImp für das randomForest-Modell

Ich habe Probleme zu verstehen, wie die varImpFunktion für ein randomForest-Modell mit dem caretPaket funktioniert . Im folgenden Beispiel erhält das Merkmal var3 mithilfe der Caret- varImpFunktion die Bedeutung Null , das zugrunde liegende randomForest-Endmodell hat jedoch für das Merkmal var3...

10
Regression für Winkel- / Kreisdaten

Ich habe Lernprobleme überwacht, bei denen Ziele Winkel sind. Wenn ich eine einfache Regression durchführen würde, wären die Zahlen 360 und 1 für mein Modell weit entfernt, aber tatsächlich sind sie nahe beieinander und die Vorhersage von x- und y-Koordinaten fühlt sich nicht richtig an, da ich...

10
Warum mögen Menschen reibungslose Daten?

Ich soll den Squared Exponential Kernel (SE) für die Gaußsche Prozessregression verwenden. Die Vorteile dieses Kernels sind: 1) einfach: nur 3 Hyperparameter; 2) glatt: Dieser Kernel ist Gaußsch. Warum mögen die Leute "Glätte" so sehr? Ich weiß, dass der Gaußsche Kern unendlich differenzierbar ist,...

10
Was ist die maximale Wahrscheinlichkeitsschätzung der Kovarianz bivariater Normaldaten, wenn Mittelwert und Varianz bekannt sind?

Angenommen, wir haben eine Zufallsstichprobe aus einer bivariaten Normalverteilung, die Nullen als Mittelwerte und Einsen als Varianzen enthält. Der einzige unbekannte Parameter ist also die Kovarianz. Was ist die MLE der Kovarianz? Ich weiß, es sollte so etwas wie aber woher wissen wir...