Statistiken und Big Data

28
Was steckt hinter der Google Prediction-API?

Google Prediction API ist ein Cloud-Dienst, bei dem Benutzer einige Trainingsdaten übermitteln können, um einen mysteriösen Klassifikator zu trainieren, und ihn später auffordern können, eingehende Daten zu klassifizieren, um beispielsweise Spam-Filter zu implementieren oder Benutzereinstellungen...

28
Eine Anpassung der Kullback-Leibler-Distanz?

Schau dir dieses Bild an: Wenn wir eine Stichprobe aus der Rotdichte ziehen, werden einige Werte voraussichtlich unter 0,25 liegen, während es unmöglich ist, eine solche Stichprobe aus der Blauverteilung zu erzeugen. Infolgedessen ist der Kullback-Leibler-Abstand von der roten zur blauen Dichte...

28
Probleme mit Kreisdiagrammen

Es scheint eine zunehmende Diskussion über Kreisdiagramme zu geben. Die Hauptargumente dagegen scheinen zu sein: Fläche wird mit weniger Kraft als Länge wahrgenommen. Kreisdiagramme haben ein sehr geringes Datenpunkt-zu-Pixel-Verhältnis Ich denke jedoch, dass sie irgendwie nützlich sein können,...

28
Berechnung der Wiederholbarkeit von Effekten aus einem früheren Modell

Ich bin gerade auf diese Arbeit gestoßen , in der beschrieben wird, wie die Wiederholbarkeit (auch bekannt als Zuverlässigkeit, auch bekannt als Intraclass-Korrelation) einer Messung über Mixed-Effects-Modellierung berechnet wird. Der R-Code wäre: #fit the model fit =

28
Warum wird RSS Chi-Quadrat-mal np verteilt?

Ich möchte , verstehen , warum unter dem OLS - Modell, die RSS (Restsumme der Quadrate) verteilt wird ( die Anzahl der Parameter in dem Modell ist, die Anzahl der Beobachtungen).χ2⋅(n−p)χ2⋅(n−p)\chi^2\cdot (n-p)pppnnn Ich entschuldige mich dafür, dass ich eine so grundlegende Frage gestellt habe,...