Statistiken und Big Data

12
Techniken für den Umgang mit unvollständigen / fehlenden Daten

Meine Frage bezieht sich auf Techniken zum Umgang mit unvollständigen Daten während des Klassifikators / Modelltrainings / Anpassens. In einem Datensatz mit einigen hundert Zeilen, wobei jede Zeile beispielsweise fünf Dimensionen und eine Klassenbezeichnung als letztes Element aufweist, sehen die...

12
Adaptive Kernel-Dichteschätzer?

Kann jemand über seine Erfahrungen mit einem adaptiven Kernel-Dichteschätzer berichten? (Es gibt viele Synonyme: adaptive | variable | variable-width, KDE | histogram | interpolator ...) Die variable Schätzung der Kerneldichte besagt, dass "wir die Breite des Kernels in verschiedenen Regionen...

12
Artikelanalyse für einen R-Neuling

Ich versuche, einen 20-Punkte-Multiple-Choice-Test zu bewerten. Ich möchte eine Artikelanalyse durchführen, wie sie in diesem Beispiel zu finden ist . Ich möchte also für jede Frage den P-Wert und die Korrelation mit der Gesamtsumme sowie die Verteilung der ausgewählten Optionen. Ich weiß nichts...

12
Fragebögen validieren

Ich entwerfe einen Fragebogen für meine Dissertation. Ich bin dabei, den Fragebogen zu validieren, den ich mit einem Cronbach-Alpha-Test für die Erstmustergruppe erstellt habe. Die Beantwortung des Fragebogens erfolgt auf einer Likert-Skala. Kann jemand weitere Tests vorschlagen, um die Gültigkeit...

12
Aktualisierung des Lassos mit neuen Beobachtungen

Ich passe eine L1-regulierte lineare Regression an einen sehr großen Datensatz an (mit n >> p.). Die Variablen sind im Voraus bekannt, aber die Beobachtungen treffen in kleinen Stücken ein. Ich möchte das Lasso nach jedem Stück fit halten. Ich kann natürlich das gesamte Modell nach jedem...

12
Verwendung von CDF- und PDF-Statistiken zur Analyse

Dies mag eine zu allgemeine Frage sein, aber ich hoffe, dass ich hier Hilfe finden kann. Ich beginne einen RA-Job an meiner Universität und mein Thema wird sich mit Internet-Verkehrsanalyse befassen. Ich bin ziemlich neu in der Welt der Analyse, aber ich denke, in der Welt der Forschung ist dies...

12
Wie berechnet man die Erwartung von

Wenn XiXiX_i exponentiell verteilt ist (i=1,...,n)(i=1,...,n)(i=1,...,n) mit dem Parameter λλ\lambda und XiXiX_i ‚s ist voneinander unabhängig, was die Erwartung (∑i=1nXi)2(∑i=1nXi)2 \left(\sum_{i=1}^n {X_i} \right)^2 in Bezug auf nnn undλλ\lambda und möglicherweise andere Konstanten? Hinweis:...