Statistiken und Big Data

12
Was macht ein Statistiker?

Wenn ich meinen nicht-statistischen Freunden erzähle, dass ich ein Doktorand in Statistik bin, sagen sie natürlich: "Oh, also wollen Sie Professor werden?". Ich sage nein, ich plane tatsächlich, in der Industrie zu arbeiten. Dann antworten sie mit "und machen was?". Ich habe keine gute Antwort auf...

12
Faktorwerte aus diskreten, ordinalen Antworten

Gibt es eine prinzipielle Möglichkeit, Faktorwerte zu schätzen, wenn Sie ordinale, diskrete Variablen haben? Ich habe ordinale, diskrete Variablen. Wenn ich davon ausgehe, dass jeder Antwort eine kontinuierliche, normalverteilte Variable zugrunde liegt, kann ich eine n × n polychrone...

12
SVM-Regression verstehen: objektive Funktion und „Ebenheit“

SVMs zur Klassifizierung machen für mich intuitiv Sinn: Ich verstehe, wie minimierend ||θ||2||θ||2||\theta||^2 ergibt den maximalen Spielraum. Ich verstehe dieses Ziel jedoch nicht im Kontext der Regression. Verschiedene Texte ( hier und hier ) beschreiben dies als Maximierung der "Ebenheit". Warum...

12
Akinator.com und Naive Bayes Klassifikator

Kontext: Ich bin ein Programmierer mit etwas (halb vergessener) Erfahrung in der Statistik von Uni-Kursen. Kürzlich bin ich auf http://akinator.com gestoßen und habe einige Zeit damit verbracht, es zum Scheitern zu bringen. Und wer war das nicht? :) Ich habe beschlossen, herauszufinden, wie es...

12
Filtern eines Datenrahmens

Lernen Sie immer noch die Grundfunktionen in R. Die Teilmengenfunktion scheint nur eine Bedingung basierend auf einer einzelnen Spalte mit oder ohne mehrere Bedingungen zu filtern. Wie kann ich einfach Daten aus einem Datenrahmen filtern? wenn Sie mit mehreren Bedingungen versehen sind Wenn die...

12
80% der fehlenden Daten in einer einzelnen Variablen

Es gibt eine Variable in meinen Daten, bei der 80% der Daten fehlen. Die Daten fehlen wegen Nichtvorhandenseins (dh wie viel Bankdarlehen das Unternehmen schuldet). Ich bin auf einen Artikel gestoßen, in dem es heißt, dass die Dummy-Variable-Einstellmethode die Lösung für dieses Problem ist....

12
Sweave, R, Latex, Eclipse StatET einrichten [closed]

Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Kreuz Validated. Geschlossen vor 2 Jahren . Vor ein paar Tagen habe ich einen Beitrag über das Einrichten eines...

12
Online skalierbare statistische Methoden

Dies wurde durch eine effiziente lineare Online-Regression inspiriert , die ich sehr interessant fand. Gibt es Texte oder Ressourcen, die für statistische Berechnungen in großem Maßstab vorgesehen sind, bei denen die Datenmengen zu groß sind, um in den Hauptspeicher zu passen, und die...

12
Analysieren von Winddaten mit R

Hallo, ich analysiere Winddaten, um die Energie einer Windkraftanlage abzuschätzen. Ich habe 10 Jahre Winddaten genommen und ein Histogramm erstellt. Meine zweite Stufe bestand darin, eine Weibull-Verteilung an die Daten anzupassen. Ich habe R mit dem Paket verwendet lmom, um die Weibul-Form zu...