Statistiken und Big Data

15
Kann ich Koeffizienten für nicht signifikante Faktorstufen in einem linearen Modell ignorieren?

Nachdem ich hier die linearen Modellkoeffizienten geklärt habe, habe ich eine weitere Frage bezüglich der Nicht-Signifikanz (hoher p-Wert) für Koeffizienten von Faktorstufen. Beispiel: Wenn mein lineares Modell einen Faktor mit 10 Stufen enthält und nur 3 dieser Stufen mit signifikanten p-Werten...

15
Notation der Schätzer (Tilde vs. Hut)

1. Gibt es eine Namenskonvention für den Hut und das Tildesymbol in den Statistiken? Ich fand β für einen Schätzer beschreibt ( Wikipedia ) Aber ich fand auch beschreibt einen Schätzer für ( Wolfram ). Gibt es einen Unterschied in der Bedeutung? Im Internet habe ich einen Unterschied festgestellt,...

15
Wie bekomme ich ein R-Quadrat für eine Löß-Passform?

Wie berechnet man die R-Quadrat- Statistik ( ) in R für und / oder die Funktionsausgabe? Zum Beispiel für diese Daten:r2r2r^2loesspredict cars.lo <- loess(dist ~ speed, cars) cars.lp <- predict(cars.lo, data.frame(speed = seq(5, 30, 1)), se = TRUE) cars.lphat zwei Arrays fitfür Modell- und...

15
So erweitern Sie den Datenrahmen in R

Verschlossen . Diese Frage und ihre Antworten sind gesperrt, da die Frage nicht zum Thema gehört, aber von historischer Bedeutung ist. Derzeit werden keine neuen Antworten oder Interaktionen akzeptiert. Ich habe folgendes Problem, während ich eine Analyse mit R

15
Zeitreihen- und Anomalieerkennung

Ich möchte einen Algorithmus zum Erkennen einer Anomalie in Zeitreihen einrichten und plane, dafür Clustering zu verwenden. Warum sollte ich eine Distanzmatrix für das Clustering verwenden und nicht die rohen Zeitreihendaten ?, Zum Erkennen der Anomalie verwende ich Dichtebasiertes Clustering,...

15
Wann sollte man GMM in Betracht ziehen?

Eines der Dinge, die die Ökonometrie einzigartig machen, ist die Verwendung der Technik der verallgemeinerten Methode der Momente. Welche Arten von Problemen machen GMM geeigneter als andere Schätztechniken? Was bringt Ihnen die Verwendung von GMM in Bezug auf Effizienz oder verminderte Verzerrung...

15
Vorteile von ROC-Kurven

Was sind die Vorteile der ROC-Kurven? Zum Beispiel klassifiziere ich einige Bilder, was ein binäres Klassifizierungsproblem ist. Ich extrahierte ungefähr 500 Merkmale und wendete einen Merkmalsauswahlalgorithmus an, um einen Satz von Merkmalen auszuwählen, dann wendete ich SVM zur Klassifizierung...