Als «standard-error» getaggte Fragen

12
Wie führt man eine Imputation von Werten in einer sehr großen Anzahl von Datenpunkten durch?

Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

11
R / mgcv: Warum produzieren te () und ti () Tensorprodukte unterschiedliche Oberflächen?

Das mgcvPaket für Rhat zwei Funktionen zum Anpassen von Tensorproduktwechselwirkungen: te()und ti(). Ich verstehe die grundlegende Arbeitsteilung zwischen den beiden (Anpassen einer nichtlinearen Wechselwirkung vs. Zerlegen dieser Wechselwirkung in Haupteffekte und eine Wechselwirkung). Was ich...

10
R lineare Regression kategoriale Variable "versteckter" Wert

Dies ist nur ein Beispiel, auf das ich mehrmals gestoßen bin, daher habe ich keine Beispieldaten. Ausführen eines linearen Regressionsmodells in R: a.lm = lm(Y ~ x1 + x2) x1ist eine stetige Variable. x2ist kategorisch und hat drei Werte, z. B. "Niedrig", "Mittel" und "Hoch". Die von R gegebene...

10
Allgemeine Methode zur Ableitung des Standardfehlers

Ich kann anscheinend nirgendwo eine allgemeine Methode finden, um Standardfehler abzuleiten. Ich habe auf Google, dieser Website und sogar in Lehrbüchern nachgesehen, aber alles, was ich finden kann, ist die Formel für Standardfehler für Mittelwert, Varianz, Anteil, Risikoverhältnis usw. und nicht,...

9
Konfidenzintervalle für den Median

Ich habe eine Verteilung von Proben mit einer kleinen Anzahl von Werten in jeder (weniger als ). Ich habe den Median für jede Stichprobe berechnet, den ich mit einem Modell vergleichen und die Differenz zwischen dem Modell und dem Median jeder Stichprobe ermitteln möchte. Um ein konsistentes...

9
Wofür wird der Standardfehler verwendet?

Ich verwende ein Tutorial, das ich gefunden habe, und zeichne Mittelwerte zusammen mit den Standardfehlern, um meine Daten anzuzeigen. Aber ich habe ein Problem damit, die Ergebnisse zu diskutieren. Mein Diagramm sieht wie folgt aus: Einige der Standardfehler (als Fehlerbalken dargestellt)...

8
Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?

Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly...