Statistiken und Big Data

17
R: Korrelation nach Gruppe berechnen

Verschlossen . Diese Frage und ihre Antworten sind gesperrt, da die Frage nicht zum Thema gehört, aber von historischer Bedeutung ist. Derzeit werden keine neuen Antworten oder Interaktionen akzeptiert. In R habe ich einen Datenrahmen, der eine Klassenbezeichnung C

17
Nichtparametrische Bayes'sche Analyse in R

Ich bin auf der Suche nach einem guten Tutorial zum Clustering von Daten Rmithilfe des hierarchischen Dirichlet-Prozesses (HDP) (eine der neuesten und beliebtesten nichtparametrischen Bayes-Methoden). Für die nichtparametrische Bayes'sche Analyse gibt es DPpackage(IMHO, die umfassendste aller...

17
Warum Platt's Skalierung verwenden?

Um ein Konfidenzniveau auf eine Wahrscheinlichkeit beim überwachten Lernen zu kalibrieren (z. B. um das Vertrauen aus einer SVM oder einem Entscheidungsbaum unter Verwendung von überabgetasteten Daten abzubilden), besteht eine Methode in der Verwendung der Plattschen Skalierung (z. B. Erhalten...

17
Wie interpretiere ich Exp (B) in der Cox-Regression?

Ich bin ein Medizinstudent, der versucht, Statistiken zu verstehen (!) - seien Sie also bitte vorsichtig! ;) Ich schreibe einen Aufsatz, der eine ganze Menge statistischer Analysen enthält, einschließlich Überlebensanalysen (Kaplan-Meier, Log-Rank und Cox-Regression). Ich führte eine Cox-Regression...

17
Qualitätsmaßstab für Clustering

Ich habe einen Clustering-Algorithmus (nicht k-means) mit dem Eingabeparameter (Anzahl der Cluster). Nach dem Clustering möchte ich ein quantitatives Qualitätsmaß für dieses Clustering erhalten. Der Clustering-Algorithmus hat eine wichtige Eigenschaft. Für erhalte ich, wenn ich Datenpunkte ohne...

17
LASSO Annahmen

In einem LASSO-Regressionsszenario, in dem y= Xβ+ ϵy=Xβ+ϵy= X \beta + \epsilon , und die LASSO-Schätzungen sind durch das folgende Optimierungsproblem gegeben Mindestβ| | y- Xβ| | +τ| | β| |1minβ||y−Xβ||+τ||β||1 \min_\beta ||y - X \beta|| + \tau||\beta||_1 Gibt es irgendwelche...

17
Statistische Landschaft

Hat jemand einen kurzen Überblick über die verschiedenen Ansätze zur Statistik geschrieben? Zu einer ersten Annäherung haben Sie frequentistische und bayesianische Statistiken. Wenn Sie genauer hinschauen, haben Sie aber auch andere Ansätze wie likelihoodistische und empirische Bayes. Und dann...

17
Logistische Regression und Datensatzstruktur

Ich hoffe, dass ich diese Frage richtig stellen kann. Ich habe Zugriff auf Play-by-Play-Daten, daher ist es eher ein Problem mit der besten Vorgehensweise und der korrekten Erstellung der Daten. Was ich tun möchte, ist zu berechnen, wie wahrscheinlich es ist, ein NHL-Spiel zu gewinnen, wenn das...

17
Ist der Median fairer als der Mittelwert?

Ich habe kürzlich den Rat gelesen, dass Sie im Allgemeinen den Median verwenden sollten, um Ausreißer zu eliminieren. Beispiel: Der folgende Artikel http://www.amazon.com/Forensic-Science-Introduction-Scientific-Investigative/product-reviews/1420064932/ hat im Moment 16 Bewertungen: review= c(5,...

17
Ist „jede Person mit blauem T-Shirt“ ein systematisches Beispiel?

Ich unterrichte eine Intro-Statistik-Klasse und überprüfe die Arten der Stichproben, einschließlich systematischer Stichproben, bei denen Sie jede k-te Person oder jedes k-te Objekt stichprobenartig untersuchen. Ein Schüler fragte, ob eine Stichprobe bei jeder Person mit einem bestimmten Merkmal...