nur aus Neugier ... Welche Sprache wird hier am häufigsten verwendet? R? MATLAB? Python? Java?
Was für Prototypen oder für die Produktion? Zum Beispiel denke ich, dass MATLAB hauptsächlich für das Prototyping verwendet wird, Python für beide Prot. und Produktion ...
Antworten:
Ich könnte einer Abstimmung für R. R nicht mehr zustimmen. R ist die "Lingua Franca" der Statistikwelt. Es ist die Definition von Schneide, während die meisten Pakete für MATLAB und SAS mehrere Monate dauern. Die Sprache ist im Gegensatz zu SAS sehr einfach zu verstehen. Es gibt Ihnen auch die Möglichkeit, eine Verbindung mit C / C ++ / Python und Datenbanken herzustellen.
Betrachten Sie die Revolution Analytics-Version von R für etwas mehr Leistung.
http://www.revolutionanalytics.com/products/revolution-r.php
quelle
Nun, Sie können für MATLAB ZAHLEN und dann entweder (1) das Material programmieren, das Sie wirklich benötigen, oder (2) MEHR für MATLAB-Toolboxen ZAHLEN. Und entdecken Sie, dass das Erstellen nützlicher Statistiken in MATLAB ein nachträglicher Gedanke war, der in der zunehmend weniger nützlichen Statistik-Toolbox behandelt wurde. Oder ... Sie können R KOSTENLOS herunterladen und nach den benötigten Paketen suchen (und diese finden!), Die Sie auch KOSTENLOS herunterladen können.
In R können viele kleine Produktionsaufgaben erledigt werden. Wenn Sie etwas wirklich Großes tun (denken Sie an die US-Volkszählung), müssen Sie wahrscheinlich SAS lernen - und Ihren Arbeitgeber dazu bringen, dafür zu bezahlen.
quelle
"Popularität" hängt von der Community und der Definition von "Statistik" ab. Weltweit, einen umfassenden Überblick über „statistische Inferenz“ taking als einschließlich aller Methoden der Schlüsse zu ziehen oder Ergreifen von Maßnahmen auf der Grundlage quantitativer Daten, gibt es wenig Zweifel , dass Excel schlägt alle anderen Anwendungen, einschließlich R, SAS, Stata, SPSS und S -Plus . (Die Links verweisen auf verschiedene Arten von Statistiken, sind aber, gelinde gesagt, sehr suggestiv.) Python und MATLAB sind nicht einmal Fehler in der Statistik. Ich sage nicht, dass dies eine gute Sache ist oder dass wir es mögen sollten: So ist es eben und so wird es sehr lange bleiben.
Wir sollten keine Rückschlüsse auf das ziehen, was "hier" in diesem Forum als beliebt erscheint. Kommerzielle Softwareanbieter unterstützen ihre eigenen Foren, daher wird ein Ort wie SE natürlich Menschen bevorzugen, die weniger aktiv unterstützte Software verwenden, insbesondere kostenlose, Open-Source- und akademische Lösungen.
quelle
Anhand der beliebtesten Tags sollte klar sein, dass R die beliebteste Sprache auf dieser Website ist. Ob dies die beliebteste Sprache für statistische Analysen ist, lässt sich nicht direkt ableiten, aber man könnte dies auch annehmen.
quelle
R und SAS haben jeweils ihre Vor- und Nachteile. Ich denke, mehr Statistiker müssen sich der Tatsache bewusst sein, dass viele großartige statistische Software verfügbar sind, anstatt sich endlos darüber zu streiten, welche überlegen ist.
R ist frei. SAS ist sehr teuer. R gibt Ihnen die Möglichkeit, fast alles zu tun. SAS kann oder kann nicht. R hat erstaunliche grafische Fähigkeiten. Wenn Sie SAS-Grafiken sehen, fühlt es sich wieder wie 1985 an. SAS bietet eine hervorragende Kundenbetreuung. R support = Stunden des Durchsuchens von Mailinglistenarchiven. Auch mit einem Namen wie "R" sind Suchmaschinenergebnisse oft schlecht. R ist extrem langsam und kann mit großen Datenmengen nicht gut umgehen. SAS funktioniert gut mit großen Datenmengen. SAS ist tendenziell robuster. Nach meiner Erfahrung ist SAS überlegen, wenn es um die Modellierung gemischter Effekte oder um die Gestaltung von Experimenten (z. B. die Analyse von Crossover-Designs) geht.
Für groß angelegte Brute-Force-Simulationen verwende ich Fortran. Früher habe ich C verwendet, aber Fortran ist viel einfacher zu verwenden. Ich habe MATLAB noch nie benutzt. Wenn ich die statistische Leistung von R, aber die Geschwindigkeit von Fortran benötige, schreibe ich die zeitintensiven Operationen (dh Schleifen) in Fortran und rufe das Unterprogramm von R auf.
quelle
lme4
Paket leicht mit vielen zufälligen Effekten umgehen kann (wie z. B. bei der Beurteilung von Bildungseinrichtungen). Meine eigene (aber begrenzte) Erfahrung (SASNLMIXED
vs. Rlme4
) bestätigt diesen Punkt: R ist bei der Anwendung komplexer IRT- Modelle keineswegs langsamer als SAS und verarbeitet auch große Datenmengen (dank der cleveren C-Implementierung). .Ich bevorzuge Python und vielleicht Java. Erstens sind sie echte Programmiersprachen. Zweitens sind sie die beliebtesten Sprachen (TIOBE Index). Sie können zwischen diesen Sprachen auch mit mehreren Skriptsprachen konvertieren. In der Vergangenheit habe ich die DMelt-Plattform http://jwork.org/dmelt/ verwendet , um statistische Berechnungen durchzuführen, und ich war sehr beeindruckt von den Grafiken in 2D und 3D, die für professionelle Papiere leicht zu erreichen sind. Das R-Paket hat mich mit der Grafik nicht beeindruckt.
quelle