Statistiken und Big Data

16
Rücktransformation von Regressionskoeffizienten

Ich mache eine lineare Regression mit einer transformierten abhängigen Variablen. Die folgende Transformation wurde durchgeführt, damit die Annahme der Normalität der Residuen gelten würde. Die nicht transformierte abhängige Variable war negativ verzerrt, und die folgende Transformation hat sie...

16
Normalisierung vor der Kreuzvalidierung

Hat das Normalisieren von Daten (um einen Mittelwert von Null und eine Standardabweichung von Eins zu haben) vor dem Durchführen einer wiederholten Kreuzvalidierung eine negative Konsequenz, wie beispielsweise eine Überanpassung? Hinweis: Dies gilt für eine Situation, in der #cases> total...

16
Daten in inkonsistentem Format in R bereinigen?

Ich beschäftige mich oft mit unordentlichen Umfragedaten, die eine Menge Aufräumarbeiten erfordern, bevor Statistiken erstellt werden können. Früher habe ich das "manuell" in Excel gemacht, manchmal mit Excel-Formeln und manchmal nacheinander. Ich begann, immer mehr dieser Aufgaben zu erledigen,...

16
Benötigt MLE ID-Daten? Oder nur unabhängige Parameter?

Das Schätzen von Parametern unter Verwendung der Maximum-Likelihood-Schätzung (MLE) umfasst das Bewerten der Likelihood-Funktion, die die Wahrscheinlichkeit des Auftretens der Stichprobe (X) auf Werte (x) im Parameterraum (θ) bei gegebener Verteilungsfamilie (P (X = x | θ) abbildet Alle Beispiele,...

16
Gaußscher Prozess: Eigenschaften der Funktionsnäherung

Ich lerne etwas über den Gaußschen Prozess und habe nur Kleinigkeiten gehört. Würde mich sehr über Kommentare und Antworten freuen. Stimmt es, dass eine Gaußsche Prozessfunktionsnäherung für jeden Datensatz an den Datenpunkten null oder einen vernachlässigbaren Anpassungsfehler ergibt? An anderer...

16
Was sind R-Struktur G-Struktur in einem glmm?

Ich habe das MCMCglmmPaket vor kurzem benutzt. Ich bin verwirrt von dem, was in der Dokumentation als R-Struktur und G-Struktur bezeichnet wird. Diese scheinen sich auf die zufälligen Effekte zu beziehen - insbesondere die Angabe der Parameter für die vorherige Verteilung auf sie, aber die...