Statistiken und Big Data

12
Was ist ein guter Index für den Grad der Verletzung der Normalität und welche beschreibenden Bezeichnungen könnten diesem Index zugeordnet werden?

Kontext: In einer früheren Frage fragte @Robbie in einer Studie mit etwa 600 Fällen, warum Normalitätstests auf eine signifikante Nichtnormalität hinwiesen, die Diagramme jedoch auf Normalverteilungen hinwiesen . Mehrere Personen wiesen darauf hin, dass Signifikanztests der Normalität nicht sehr...

12
Schätzer für eine Binomialverteilung

Wie definieren wir einen Schätzer für Daten, die aus einer Binomialverteilung stammen? Für Bernoulli kann ich mir vorstellen, dass ein Schätzer einen Parameter p schätzt, aber für Binomial kann ich nicht sehen, welche Parameter zu schätzen sind, wenn wir n haben, um die Verteilung zu...

12
Mit read.csv nur zwei von drei Spalten lesen

Verschlossen . Diese Frage und ihre Antworten sind gesperrt, da die Frage nicht zum Thema gehört, aber von historischer Bedeutung ist. Derzeit werden keine neuen Antworten oder Interaktionen akzeptiert. Ich habe einen ASCII-Datensatz, der aus drei Spalten besteht, aber...

12
Hosting-Optionen für öffentlich verfügbare Daten

Sie haben sich also entschlossen, die Idee reproduzierbarer Recherchen zu unterstützen, und möchten Ihre Daten online zur Verfügung stellen, damit sie angezeigt und verwendet werden können. Die Frage ist, wo Sie es hosten? Meine erste Neigung ist natürlich der private Webspace, den ich auf einem...

12
SVM mit ungleichen Gruppengrößen in Trainingsdaten

Ich versuche, eine SVM aus Trainingsdaten zu erstellen, bei denen eine Gruppe mehr als die andere vertreten ist. Die Gruppen werden jedoch in den endgültigen Testdaten zu gleichen Teilen vertreten sein. Daher möchte ich den class.weightsParameter der e1071R-Paket-Schnittstelle verwenden libsvm, um...

12
Lasso-Modifikation für LARS

Ich versuche zu verstehen, wie der Lars-Algorithmus modifiziert werden kann, um Lasso zu erzeugen. Obwohl ich LARS verstehe, kann ich die Lasso-Modifikation aus dem Artikel von Tibshirani et al. Nicht sehen. Insbesondere verstehe ich nicht, warum die Vorzeichenbedingung darin, dass das Vorzeichen...

12
lme4 oder ein anderer Open Source R-Paketcode, der asreml-R entspricht

Ich möchte ein gemischtes Modell mit lme4, nlme, baysian regression package oder einem anderen verfügbaren Modell anpassen. Gemischtes Modell in Asreml-R-Kodierungskonventionen Bevor wir auf die Details eingehen, möchten wir vielleicht Details zu ASREML-R-Konventionen für diejenigen haben, die mit...