Statistiken und Big Data

15
Aufteilen von Bäumen in R: party vs. rpart

Es ist schon eine Weile her, dass ich mir das Teilen von Bäumen angesehen habe. Als ich das letzte Mal so etwas gemacht habe, mag ich Party in R (erstellt von Hothorn). Die Idee der bedingten Folgerung durch Stichproben ist für mich sinnvoll. Aber rpart hatte auch Anklang. In der aktuellen...

15
Was ist ein guter Ansatz, um R in einem Computerraum zu unterrichten?

Es gab mehrere gute Fragen und Antworten zu Einführungsbüchern oder Lernansätzen, z . B. hier und hier . Aber ich habe ein etwas anderes Problem - die beste Möglichkeit, eine einstündige Sitzung (oder mehrere solcher Sitzungen) in einem Computerraum durchzuführen, damit die Leute mit R beginnen und...

15
Was ist ein praktisch guter Datenanalyseprozess?

Ich möchte den Analyseprozess kennenlernen oder Referenzen darüber haben, den die meisten statistischen Datenanalysten für jedes Datenanalyseprojekt durchlaufen. Wenn ich eine "Liste" erstelle, um das Datenanalyseprojekt abzuschließen, muss ein Analyst: Sammeln Sie zuerst die Anforderungen für das...

15
Einstufung mit Tall Fat-Daten

Ich muss auf meinem Laptop einen linearen Klassifikator mit hunderttausenden Datenpunkten und etwa zehntausenden Funktionen trainieren. Welche Möglichkeiten habe ich? Was ist der Stand der Technik für diese Art von Problem? Der stochastische Gradientenabstieg scheint eine vielversprechende Richtung...

15
Sind Experten schädlich?

Ich lese "Die Rolle des Schachs in der Forschung der künstlichen Intelligenz" ( pdf ) und es heißt interessanterweise: Die Erfahrung [...] zeigt, dass die Beiträge von Schachexperten zwar allgemein nützlich, aber nicht vollständig vertrauenswürdig sind. Ein gutes Beispiel dafür ist die...

15
Wie bewerte ich die Standardabweichung?

Ich habe Antworten von 85 Personen zu ihrer Fähigkeit, bestimmte Aufgaben zu erledigen, gesammelt. Die Antworten sind auf einer Fünf-Punkte-Likert-Skala: 5 = sehr gut, 4 = gut, 3 = durchschnittlich, 2 = schlecht, 1 = sehr schlecht, Der Mittelwert liegt bei 2,8 und die Standardabweichung bei...