Statistiken und Big Data

32
Wie geht R mit fehlenden Werten in lm um?

Ich möchte einen Vektor B für jede der Spalten in einer Matrix A regressieren. Dies ist trivial, wenn keine Daten fehlen. Wenn die Matrix A jedoch fehlende Werte enthält, darf meine Regression für A nur Zeilen enthalten, in denen alle enthalten sind Werte sind vorhanden (das Standardverhalten von...

32
Gibt es ein Projekt wie Euler für maschinelles Lernen?

Ich fand Project Euler http://projecteuler.net/ unglaublich nützlich beim Erlernen von Programmiersprachen. Gibt es eine ähnliche Site für maschinelles Lernen? Ich habe http://www.kaggle.com/ gesehen , aber es ist für Anfänger bei weitem nicht so zugänglich wie Project

32
Warum würde R NA als lm () -Koeffizienten zurückgeben?

Ich passe ein lm()Modell an einen Datensatz an, der Indikatoren für das Geschäftsquartal enthält (Q1, Q2, Q3, wodurch Q4 zum Standard wird). Verwenden von lm(Y~., data = data) Ich erhalte einen NAals Koeffizienten für Q3 und eine Warnung, dass eine Variable aufgrund von Singularitäten...

32
Logistische Kernel-Regression vs. SVM

Wie allen bekannt ist, kann SVM die Kernel-Methode verwenden, um Datenpunkte in höhere Räume zu projizieren, sodass Punkte durch einen linearen Raum getrennt werden können. Wir können aber auch die logistische Regression verwenden, um diese Grenze im Kernelraum zu wählen. Was sind also die Vorteile...

32
Vergleich zweier Modelle mit der Funktion anova () in R

Aus der Dokumentation für anova(): Wenn 'anova' eine Sequenz von Objekten erhält, werden die Modelle in der angegebenen Reihenfolge gegeneinander getestet ... Was bedeutet es, die Modelle gegeneinander zu testen? Und warum ist die Bestellung wichtig? Hier ist ein Beispiel aus dem GenABEL-Tutorial :...