R vs SAS, warum wird SAS von privaten Unternehmen bevorzugt?

143

Ich habe R gelernt, aber es scheint, dass Unternehmen viel mehr an SAS-Erfahrungen interessiert sind. Was sind die Vorteile von SAS gegenüber R?

Benoit_Plante
quelle
17
Es ist tragisch, aber wahr, ich fürchte ...
gung
19
Ein medizinischer Statistiker hat mir einmal gesagt, dass er SAS einsetzt, denn wenn er aufgrund von Softwarefehlern Fehler macht und es zu Klagen kommt, wird SAS diese entschädigen. R kommt ohne Garantie.
Momo
42
@Momo R kommt ohne Garantie, stimmt, aber ich würde gerne eine Referenz sehen, die SAS so stark hat. Ich konnte den SAS-Lizenztext nicht auf der Website finden, konnte jedoch etwas für eine Komponente finden: support.sas.com/documentation/onlinedoc/sasc/doc650/common/…. Auf die Medien wird eine Garantie von 90 Tagen gewährt Die Software wird mitgeliefert und schließt jegliche andere Gewährleistung vollständig aus. Bitte geben Sie einen anderen Verweis als "Jemand hat es mir einmal gesagt" an.
Brian Diggs
13
War nur als Anekdote gedacht, ich mag den pragmatischen Zynismus des Kommentars. Aber ich bin froh, dass du nachgesehen hast, es hat mich nie interessiert.
Momo
36
SAS hat die gleiche Garantie wie R: keine.
Frank Harrell

Antworten:

139

Ich denke, es gibt mehrere Probleme (in aufsteigender Reihenfolge der möglichen Gültigkeit):

  1. Tradition / Gewohnheit : Die Menschen sind an SAS gewöhnt und möchten nichts Neues lernen. (Wenn Sie es schwieriger machen, denken Sie in SAS und R anders.) Dies kann für jeden gelten, der Ihnen Code senden oder Ihren Code lesen / verwenden muss, einschließlich Manager und Kollegen.
  2. Misstrauen gegenüber Freeware : Ich habe mehrere Leute sagen lassen, dass sie nicht bereit sind, Ergebnisse von R zu akzeptieren, weil Sie keine gewinnorientierte Firma haben, die den Code überprüft, um sicherzustellen, dass er korrekte Ergebnisse liefert, bevor er an Kunden geht, damit sie nicht am Ende verlieren Geschäft.
  3. Big Data : R führt Operationen mit allem aus, was sich im Speicher befindet, während SAS dies nicht unbedingt tut. Wenn sich Ihre Daten also den Grenzen Ihres Speichers nähern, treten Probleme auf.

Persönlich denke ich nur, dass # 3 einen legitimen Wert hat, obwohl es Ansätze für Big Data gibt, die mit R entwickelt wurden. Die Probleme mit # 1 sprechen für sich. Ich denke, Nummer 2 ignoriert einige Fakten: Es gibt einige Überprüfungen, die mit R zusammenhängen, viele der Hauptpakete werden von einigen der größten Namen in der Statistik geschrieben, und es gibt Studien, die die Genauigkeit verschiedener statistischer Software & R vergleichen sicherlich wettbewerbsfähig gewesen.

gung
quelle
41
Punkt 1 gewinnt an Legitimität, wenn Sie auch "vorhandene Infrastruktur" in dieses Trägheitsbanner aufnehmen. Wenn bereits Geschäftsprozesse vorhanden sind, die SAS verwenden, fallen beim Ändern Übergangskosten an. In diesem Fall wird nicht zwischen SAS und R gewählt, sondern zwischen dem Verbleib bei SAS und dem Wechsel zu R, was zu einer anderen Schlussfolgerung führen kann.
Brian Diggs
25
Der Punkt von Punkt 2 ist, dass einige R-Pakete von Experten geschrieben werden, andere nicht. Wer bürgt für sie? Wer testet sie? (Ich weiß, dass sie getestet wurden, dass sie RUN sind, aber wer testet, dass sie richtig funktionieren?) Ich weiß, Sie können den Code einsehen, aber das setzt die Zeit und die Fähigkeit voraus, den Code eines anderen zu überprüfen und zu überprüfen, häufig nach Methoden, die dies tun sind sehr komplex.
Peter Flom
18
@ PeterFlom, du sprichst einen vernünftigen Punkt an. Wenn die Pakete esoterischer werden, gibt es weniger Garantien als die grundlegenden Dinge. Aber wie weit müssen Sie gehen? Sogar SEM, das ziemlich fortgeschritten ist, wurde von John Fox in R geschrieben. Darüber hinaus macht StasK einen guten Eindruck von der Realität der Überprüfung statistischer Software in der Praxis. Schließlich ist R weitaus umfassender als alles andere. Wenn Sie also esoterische Dinge mit anderer Software tun möchten, müssen Sie diese meist selbst codieren. Wer garantiert die Richtigkeit dieses Codes?
gung
33
Wer genau prüft SAS, Stata, SPSS, Code? Kann man überhaupt feststellen, ob die von ihnen erzielten Ergebnisse anhand der von ihnen angegebenen Methoden tatsächlich korrekt umgesetzt wurden? Ich weiß zum Beispiel aus der lme4Mailingliste, dass Vergleiche mit SAS ziemlich regelmäßig auftauchen. Aber es ist unmöglich zu wissen, ob wir überhaupt solche Vergleiche anstellen sollten. Ohne Zugriff auf die Quelle müssen wir diese Unternehmen beim Wort nehmen, dass die von ihrer Software erzeugten Ergebnisse tatsächlich gültig sind. Ehrlich gesagt, bevorzuge ich die Möglichkeit, den von mir verwendeten Software-Code zu überprüfen.
Jason Morgan
28
Es stimmt, aber es ist schwierig, ein statistisches Computersystem für seine Vollständigkeit zu bestrafen. Oder anders ausgedrückt: Rs Art, etwas zu tun, ist besser als die Art, es nicht zu tun.
Frank Harrell
105

Zusätzlich zu den bisher guten Antworten möchte ich den Peinlichkeitsfaktor hinzufügen. Wenn Sie im letzten Jahr Hunderttausende von Dollar für SAS- und SAS-Support ausgeben und nichts für R ausgeben möchten, mit extrem niedrigen Supportpreisen (Revolution usw.), wird sich jemand in der Kette fragen, warum. War es ein Fehler, letztes Jahr so ​​viel Geld auszugeben, als es R letztes Jahr gab? Oder ist es ein Fehler, professionelle Software für etwas zu löschen, das von einer Gruppe von Freiwilligen erstellt wurde?

Sobald das Problem auf diese Weise formuliert ist, ist es ein Verlust-Verlust-Vorschlag. Vielleicht ist es besser, es nicht zur Sprache zu bringen.

Wayne
quelle
47
Dies ist vielleicht die zynischste Antwort auf Cross Validated. +1
Wahrscheinlichkeitslogik
11
@ probabilityislogic: Danke! Um es klar auszudrücken, handelt es sich eher um einen Kommentar zu einer schlechten Verwaltung auf höherer Ebene als zu den Personen, die die Software verwenden. Ich habe an Orten gearbeitet, an denen es wirklich eine Einstellung gab (auf höheren Ebenen) Sie kürzen Ihr Budget für das nächste Jahr und geben der Abteilung, die die Ausgaben übernahm, das Extra. " Dilbert Rules.
Wayne
11
"Sie haben das Geld nicht ausgegeben ..." - genau so funktionierte das sowjetische Planungssystem nach meinem Wissen aus erster Hand.
StasK
5
Jemand in der Kette muss erklären, dass Sie R Studio Server für einen Bruchteil der Kosten einer SAS-Lizenz auf einer AWS Virtual Machine mit 16 Kernen und 256 GB RAM installieren können - in den Händen von 2 guten R-Programmierern, das ist mehr Leistungsstärker als alles, was SAS kann. Überlegen Sie, wie schnell Milliarden Datensätze fuzzy aufeinander abgestimmt werden können! Oder sogar Open Source PostgreSQL mit Python + PERL wird zu einem Bruchteil der Kosten erreicht.
Vagabund
1
"Oder ist es ein Fehler, professionelle Software für etwas zu löschen, das von einer Gruppe von Freiwilligen erstellt wurde?" Dies ist eine falsche Zweiteilung!
kjetil b halvorsen
54

Oben drauf, was Gung hier richtig erkannt hatDas größte Problem in der Unternehmenswelt ist das Erbe. Und wenn Sie einen Produktionscode von guter Qualität haben, von dem bekannt ist, dass er diese Aufgabe erfüllt, ändern Sie ihn nicht. SAS war seit den 1970er Jahren auf dem Markt und war zu dieser Zeit die einzige effektive statistische Skriptsprache nach damaligen Standards. Die Menge an Produktionscode, die seitdem in SAS in Pharma und Regierung angesammelt wurde, ist unvorstellbar, Zehntausende von Menschenjahren. Das Umschreiben in R oder Stata würde einige Jahre dauern, der resultierende Code wird flexibler, effizienter, transparenter, einfacher und kostengünstiger zu warten sein, aber niemand wird für ein solches Refactoring bezahlen. (Meine Erfahrung dabei ist, dass mein Stata-Code im Allgemeinen etwa dreimal kürzer ist. Ich hatte einmal ein Projekt, in dem SPSS-Code in Stata konvertiert wurde und das ich etwa 20 Mal kürzer gemacht habe.

In gewisser Hinsicht ist dies eine ähnliche Geschichte wie bei den akademischen Verlagen: Sie ziehen eine Flut von Endnutzern mit, die ihre Abonnements aus der Not heraus pflegen. Eine Universität ohne Abonnement für die Natur ist eigentlich keine Universität. Das kostenlose Veröffentlichen über Fachgesellschaften wird es billiger machen, die Leute bereiten ihre Einreichungen in diesen Tagen in LaTeX vor, damit sie kamerafertig sind, und die gleichen Leute werden das Peer Review anbieten, so dass es in keiner Dimension zu Qualitätsverlusten kommt. Aber ... es gibt keinen Markennamen und den Einflussfaktor hinter den Online-Journalen.

Das fasst alles zusammen: http://scatter.wordpress.com/2011/06/28/stata-12/ . Stata wird in wirtschafts- und politikbezogenen Kreisen bevorzugt, und je mehr ich SAS lerne, desto mehr mag ich Stata.

StasK
quelle
38
SAS hat eine entsetzliche Syntax, die mit etwas ähnlichem wie JCL (IBMs Job Control Language) für die Übermittlung von Lochkartenstapelaufträgen begann. Es ist bemerkenswert, dass die Leute es immer noch benutzen.
Wayne
6
+1 Besonders gut gefallen hat mir das BlackBerry: iOS: Android: Nokia als SAS: Stata: R: SPSS-Analogie im Scatterplot-Beitrag.
Jthetzel
6
Wayne, wenn Sie schon einmal über CARDS nachgedacht haben, stellen Sie fest, dass SAS das statistische Softwarepaket für die Arbeit mit Lochkarten ist. Stata arbeitet mit rechteckigen Datensätzen. R arbeitet mit Objekten. Je nachdem, mit welchem ​​Datenformat Sie zu tun haben, ist eines möglicherweise besser als andere.
StasK
3
Ein wichtiger Punkt im Erbe sind Dinge wie die FDA-Zulassung oder ähnliche Vorschriften. Die Industrie, mit der ich gesprochen habe, wird nichts (TM) mehr anfassen, nachdem sie das durchgemacht haben, um sicherzugehen, dass sie den gesamten Prozess nicht noch einmal durchlaufen müssen. Und das ist ein großes Argument in Bezug auf Geld.
cbeleites
48

Ich habe in den letzten sieben Jahren so effektiv wie ein SAS-Programmierer gearbeitet, und neben mir hat ein Kollege SAS länger programmiert, als ich am Leben war. Wie hier erwähnt, steckt hinter SAS eine enorme Menge an Trägheit / Vermächtnis. aber SAS ist genau wie R ein Weg zu einem Mittel, nicht das Mittel selbst.

SAS ist beim sequentiellen Datenzugriff äußerst effizient, und der Datenbankzugriff über SQL ist äußerst gut integriert. PROCs sind sehr gut dokumentiert, aber leider nicht vollständig mit Notation standardisiert (PROC OPTMODEL und IML sind zwei Beispiele). Es ist ein bisschen umständlich, wenn es darum geht, komplizierten Code zu schreiben, und nicht so elegant für parallelen Code. Ich habe auch festgestellt, dass das Importieren von CSV-Dateien zuweilen ein Grund für großes Elend ist und es vorziehe, sie zuerst in R und dann in einer Datenbank abzulegen.

Obwohl SAS Schnittstellen zu gemeinsam genutzten Objekten und DLLs hat, haben Sie keinen guten Zugriff auf Header-Dateien oder ähnliches, und die Codeverteilung ist auch nicht über Happy Packages möglich.

Es gibt jedoch wenig Bedenken gegen jemanden, der ein nicht mehr existierendes oder kaputtes Paket in Ihren Code einbindet, das Sie jetzt pflegen müssen, und die Qualität des Codes in SAS ist in der Regel einheitlich hervorragend (R-Core-Code ist ebenfalls hervorragend und auch frei verfügbar) für jedermann verfügbar).

Wie bereits erwähnt, ist SAS auch extrem teuer, aber es ist ein gutes Werkzeug, das ich in Anspruch nehme, wenn ich weiß, dass es ein Dosenverfahren gibt, das für meine Anforderungen gut geeignet ist.

R + SAS + MySQL mit ein bisschen Perl zum Zusammenkleben funktioniert erstaunlich :)

Jonathan Lisic
quelle
11
Die Bemerkung, alte Pakete zu pflegen, passt genauso gut zu einem benutzergeschriebenen Makro oder einem alten Prozess, den sas nicht aktualisiert hat.
Wahrscheinlichkeitslogik
4
R hat in letzter Zeit auch eine sehr gute SQL-Unterstützung durch die dplyrBibliothek erhalten - es übersetzt die R / dplyr-Syntax buchstäblich in SQL und ruft die Datenbank auf. Sie können entscheiden, welche Operationen auf dem Datenbankserver und welche lokal mit derselben Syntax ausgeführt werden sollen: cran.r-project. org / web / packages / dplyr / vignettes / databases.html
Tim
41

Ich verwende also sowohl R als auch SAS - zugegebenermaßen im akademischen Bereich -, aber es gibt ein paar Gründe, warum ich manchmal zu SAS tendiere:

  1. Bessere Dokumentation. R wird diesbezüglich immer besser, aber die Dokumentation, insbesondere die offizielle Dokumentation, ist oft schrecklich und undurchsichtig. Darüber hinaus wird SAS von einer riesigen Infrastruktur an Büchern unterstützt - der Verwendung von R! series hilft dies in R, aber es ist noch nicht ganz da. Ich kann mich an Paul Allisons Survival Analysis Using SAS oder Categorical Data Analysis Using SAS oder an das Buch wenden, das ich über Monte-Carlo-Methoden unter Verwendung von SAS habe, und ich habe ein Buch, das für die von mir verwendete Sprache in einem ziemlich konsistenten Stil geschrieben ist.
  2. Trägheit. Dies ist nicht nur "Unternehmen sind faul" - Trägheit hat auch Wert. Es gibt institutionelles Wissen. So-and-so hat Code, der das macht - und es gut macht.
  3. Pakete. Einige Pakete in R sind erstaunlich. Einige Pakete sind nicht. Sie müssen sie suchen, bewerten und selbst dann gibt es einige Glaubenssprungprobleme, da das Paket nur so gut ist, wie der Typ, der es schreibt. Es ist schwer, dem zu vertrauen. SAS hat im Wesentlichen das "volle Vertrauen und den Kredit des SAS-Instituts", das eine ziemlich solide Erfolgsbilanz vorweisen kann.
  4. Single-Source-Support. Wenn SAS defekt ist, rufen Sie SAS an. Wenn R kaputt ist, rufst du ....?
Fomite
quelle
21
"Wenn R kaputt ist, rufst du ...?" Brian Ripley :-) (+1 für diese gut argumentierte Antwort)
chl
6
Zu 4) denke ich, dass es eine Verwechslung von Begriffen gibt. Wenn Sie ein Programm verwenden und es nicht funktioniert, haben Sie im Allgemeinen zwei Möglichkeiten. Sie können für die Unterstützung bezahlen oder sich um frei verfügbare Unterstützung bemühen (Online-Community, Literatur, selbst). R und SAS können als statistische Programmiersprachen verglichen werden. Beide haben frei verfügbaren Support, der auch verglichen werden kann. R und SAS können nicht als kostenpflichtige Support-Lösungen verglichen werden ...
jthetzel
7
... SAS Institute bietet bezahlten Support für SAS. Unternehmen wie Revolution Analytics und TIBCO (S +) bieten kostenpflichtigen Support für R an. Wenn Sie kostenpflichtige Supportlösungen für R und SAS vergleichen möchten, sollten Sie SAS Institute mit Revolution Analytics und TIBCO vergleichen, nicht mit R. Die Verwirrung ergibt sich meiner Meinung nach aus die enge Integration der SAS-Sprache in das SAS-Institut und die Nicht-Integration der R-Sprache in die R-bezogene Unternehmensunterstützung und -ausbildung.
Jthetzel
3
@jthetzel Ich glaube nicht, dass es "verwirrend" ist. SAS die Sprache ist eng mit SAS der Dienst gekoppelt. Jede Plattform, auf der SAS arbeitet, wird von SAS unterstützt. Dies gilt nicht für die R-Unterstützung und die Sprache ist entkoppelt. Je nach Plattform gibt es möglicherweise keine Hilfe für Sie (versuchen Sie, mit Revolution zu sprechen, wenn Sie nicht Windows oder RHEL verwenden ...), und sie übernehmen nicht unbedingt die Verantwortung dafür RandomPackage-Fehler, bei denen als SAS PROC Arbitrary unterstützt.
Fomite
2
@probabilityislogic Ich denke, es ist mehr als nötig, es zu bewerten, um zu sehen, ob es für Ihre Analyse geeignet ist. Ja, beide könnten falsch sein und beide müssen bewertet werden. Aber ich vertraue mehr dem SAS-Team für Qualitätskontrolle als mir allein.
Fomite
39

Niemand hat behauptet, der Grund, warum dies bevorzugt wird, sei reine Idiotie. Hier sind zwei Zitate, auf die ich kürzlich gestoßen bin:

"Der Einsatz von Open-Source-Software wie R kam nicht in Frage - wir konnten kein perfekt reproduzierbares Ergebnis garantieren."

und

"Wir können hierfür keinen Support leisten, da es sich um Open Source-Software handelt."

Zwei Minuten mit diesen Leuten würden ihnen zeigen, wie falsch sie sind.

Raumfahrer
quelle
3
Zwei Minuten mit welchen Leuten? Ohne Referenzen ist es fast so, als hätten Sie sich gerade diese Zitate ausgedacht.
David Heffernan
4
Das zweite Zitat von einer IT-Abteilung des Rates scheint in Ordnung zu sein. Es ist nicht zu erwarten, dass sie alle möglichen Open-Source-Softwareprodukte unterstützen, die ein Kunde möglicherweise verwendet, daher die allgemeine Warnung. Ich denke, das schlimmste Anti-Open-Source-Zitat, das ich gehört habe, war von SAS, als er sagte: "Würdest du einem Jumbo-Jet vertrauen, der in Open Source entwickelt wurde, könnte ein Motor
ausfallen
5
@PaulHurleyuk: +1 Das Zitat lautete: „Wir haben Kunden, die Triebwerke für Flugzeuge bauen. Ich bin glücklich , sie sind nicht kostenlos zu verwenden , wenn ich auf einem Jet bekommen.“Von einem SAS Marketing - Direktor in dieser New York Times Artikel über R . Die SAS-Vertreterin erläuterte ihre Bemerkungen in einem späteren Blogbeitrag .
Jthetzel
4
@PaulHurleyuk: Ebenso wenig kann vom Council erwartet werden, dass er proprietäre Software unterstützt, die der Kunde möglicherweise verwenden möchte. Die Offenheit ist nicht der Grund. Wenn sie gesagt hätten, dass sie nichts außerhalb ihrer unterstützten Software unterstützen könnten, wäre das in Ordnung.
Spacedman
5
In den beiden Fällen, die ich zitiere, könnte es durchaus eine rationale Entscheidung geben, aber die angegebenen Gründe sind eindeutig nicht diese Gründe. Ein vernünftiger Grund könnte sein: "Wir unterstützen SAS bereits und können es uns nicht leisten, zwei Statistikpakete zu unterstützen." Aber "Wir können das nicht unterstützen, weil es Open Source ist" ist keine Folge. Die beiden Teile mögen zutreffen, aber die Schlussfolgerung folgt nicht. Es ist so, als würde man sagen "Elizabeth ist die Königin, weil der Himmel blau ist".
Spacedman
23

Ein Thema scheint nicht explizit angesprochen worden zu sein: die Arschdeckung. Wenn Sie sich für SAS entscheiden und die Dinge in die Luft jagen, kann der Entscheidungsträger immer sagen, dass er hochmoderne Software gekauft hat, und woher sollte er wissen, dass diese kaputt gehen würde? Wenn er sich für R entscheidet, wird dieses Argument schwerer zu machen sein. Ja, dies hängt mit dem hier bereits erwähnten Trägheitsargument zusammen.

Vor ein paar Jahrzehnten sagten sie, dass "Noboby jemals für den Kauf von IBM gefeuert wurde" , was als die beste Marketingphrase aller Zeiten bezeichnet wurde.

Stephan Kolassa
quelle
2
Obwohl ich nicht sicher bin, wie R weniger auf dem neuesten Stand als SAS ist (und was viele Verfahren betrifft, habe ich den Eindruck, dass R mehr auf dem neuesten Stand als SAS ist). Ich vermute, dass viele SAS-Benutzer davon nichts wissen ...
Patrick Coulombe
21

Als Benutzer von SAS und R würde ich sagen, dass der Hauptgrund, warum wir SAS anstelle von R verwenden (wenn wir dies tun), die Fähigkeit zur sequentiellen Verarbeitung ist. Wir brauchen nur Rechner mit nicht mehr als 4 GB RAM, um Daten im Wert von 15 Jahren zu verarbeiten. Ich würde eine viel größere Maschine mit Lager R benötigen und habe nicht versucht, den SAS-Code für die Ausführung mit Revolution R zu migrieren.

dmonder
quelle
8
+1, obwohl es einige Möglichkeiten gibt, mit Datasets mit mehr als Speicher in R zu arbeiten ( bigmemory , ff , Chunking von Daten aus einer Datenbank, eine breite Palette verteilter Rechenoptionen). Aber das alles erfordert Setup. SAS tuckert in der Tat alles durch, was Sie darauf werfen, was ein echter Vorteil ist.
Matt Parker
21

Die Zeiten ändern sich

Seit 2015 bevorzugen Versicherungsmathematiker unter 35 Jahren R - in den Lehrbüchern wird sowohl R- als auch SAS-Code verwendet. Ältere Aktuare haben nie gelernt, R zu verwenden und bevorzugen SAS und verwenden kein R. Der Anteil der Aktuare, die tatsächlich in SAS codieren, wird sinken.

Wenn Sie in Google Scholar nach Artikeln suchen, die sich auf SAS beziehen, werden Sie in den letzten Jahren stetig 550 Veröffentlichungen pro Jahr finden. Wenn Sie mit R ("R Foundation for Statistical Computing") nach Artikeln suchen, waren es 2014 25.100 und Mitte Juli 2015 waren es 16.700. Plotten Sie die Rate - es wächst sehr schnell!

SAS hat sich ein paar Jahre lang nicht selbst geholfen, indem sie von den Universitäten hohe Lizenzgebühren verlangte - die sie seitdem rückgängig gemacht haben -, aber es ist jetzt zu spät, dass viele Universitäten auf das Unterrichten mit R und nicht auf SAS umgestellt haben.

Neue statistische Techniken werden in Artikeln in Verbindung mit einem R-Paket veröffentlicht. Einige Techniken, die sich seit Jahren in Base R befinden, sind in SAS noch nicht enthalten. Sie können R jetzt in SAS verwenden.

Zusammenfassend ändern sich die Dinge und ändern sich schnell.

Sean
quelle
19

In der Pharmaindustrie wird SAS verwendet, weil es das ist, was die FDA verwendet und mag. Es gibt jedoch einige schwerwiegende Gründe. Die Ergebnisse sind nachvollziehbar und die Ausgabe hat einen Zeitstempel. FDA-Statistiker können überprüfen, was Sie erhalten. Es ist sehr gut für die Datenbankverwaltung und es ist eine zuverlässige Software. Natürlich kann behauptet werden, dass viele der Attribute von SAS in anderen Software-Paketen vorhanden sind, einschließlich R und SAS, was teuer ist. Dennoch denke ich, dass jeder, der ein angewandter Statistiker sein möchte, der in der Industrie arbeitet, am besten darin ist, zumindest das Programmieren in SAS zu erlernen. Verwenden Sie R oder STATA, wenn Sie es vorziehen, aber SAS kennen. Wenn Sie für ein Unternehmen arbeiten, das SAS verwenden möchte, wird die Lizenz dafür bezahlt.

Michael Chernick
quelle
4
Hier einige zusätzliche Informationen zu den Überlegungen der FDA in Bezug auf R: blog.revolutionanalytics.com/2012/06/fda-r-ok.html
Matt Parker
4
Die R Foundation veröffentlichte 2008 ein Papier über die Verwendung von R in regulierten klinischen Studien . Es sollte eine gute Referenz für Kollaborateure sein, die R.
jthetzel
2
Ich bin damit einverstanden, dass R in der klinischen Forschung verstärkt eingesetzt werden soll und dass viele der Ansicht sind, dass R genauso nachvollziehbar ist wie SAS.
Michael Chernick
6
Die FDA äußert sich ziemlich lautstark dahingehend , dass sie KEINE Software befürwortet oder benötigt. Es ist historisch richtig, dass die meisten Einreichungen SAS verwendet haben, so dass die FDA über eine Menge SAS-Kenntnisse verfügt, sich jedoch sehr schnell mit anderen Systemen befasst hat, wobei R für eine Vielzahl von Arbeiten in jüngster Zeit verwendet wurde, insbesondere im Bereich der Metaanalyse.
PaulHurleyuk
1
@PaulHurleyuk Was die FDA öffentlich sagen wird und wie sie sich in der Praxis verhalten, ist nicht unbedingt dasselbe. Die meisten Pharmaunternehmen befassen sich hauptsächlich mit klinischen Studien der Phasen II und III und erwarten im Allgemeinen, dass sie SAS für die Analyse dieser Studien benötigen und weiterhin benötigen werden.
Michael Chernick
18

Ich denke, dieses Zitat von Anne H. Milley fasst zusammen, wie viele Leute über R denken :

Wir haben Kunden, die Triebwerke für Flugzeuge bauen. Ich bin froh, dass sie keine Freeware verwenden, wenn ich in einen Jet einsteige.

Leider denke ich, dass dieses Missverständnis (frei == minderwertig) in der breiten Öffentlichkeit verbreitet ist.

Zach
quelle
16

(etwas abseits des Themas): Umgekehrt: Einige der Vorteile, die R im akademischen Bereich hat, gelten nicht für die Industrie.

Im akademischen Bereich ist es beispielsweise ein klarer Vorteil, wenn Sie den Schülern sagen können, dass sie die Software holen und zu Hause arbeiten sollen. In der Industrie sollten Sie normalerweise keine Daten mit nach Hause nehmen ...

Sie sollten auch nicht ein paar Dinge ausprobieren (TM), Tonnen von Paketen herunterladen (auch wenn diese seriös und getestet sind) und modernste Methoden anwenden. Stattdessen wird normalerweise erwartet, dass Sie sich an Methoden und Code halten, die seit Jahren verwendet werden und deren Verhalten seit langem bekannt ist. Sie würden damit nicht viele akademische Verdienste gewinnen.

Und natürlich, wie bereits erwähnt: Niemand wird es riskieren, alle Arten von behördlichen Genehmigungen zu wiederholen, um auf R umzusteigen. Soweit ich gesehen habe, geht es weniger um R als um die enormen Kosten und den Aufwand, um behördliche Genehmigungen zu erhalten .

Glaube
quelle
3
Es ist nichts zu tun, um die behördliche Genehmigung für den Wechsel zu R.
Frank Harrell
2
@Frank: Vielleicht denken wir in verschiedenen Szenarien: Ich denke, Sie denken möglicherweise an eine neue Studie (und da haben Sie Recht) - ich denke mehr an laufende Prozessanalysen (chemische + statistische Analysen) Produktion. AFAIK, Sie können Ihre Datenanalyse dort nicht einfach umschalten (aber dann ist das kein SAS-Land). Aber ich kann mich irren.
cbeleites
2
Ich kenne diese Welt nicht, aber ich vermute, dass Wissenschaftler mehr Freiheit haben, als sie denken.
Frank Harrell
13

Obwohl es ziemlich pessimistisch ist, würde meine Antwort lauten, dass die Art von Menschen, die in Unternehmen umfassende Entscheidungen treffen wie „wir verwenden nur SAS“, auch die Art von Menschen sind, die nicht vertrauen, was sie nicht verstehen, und automatisch den Wert denken von etwas ist direkt proportional zum Geldbetrag, den Sie dafür ausgeben. Dies veranlasst sie, lieber für SAS zu bezahlen als nach Alternativen zu suchen.

PaulHurleyuk
quelle
12

Warum sollte ein großes Pharmaunternehmen überhaupt von SAS auf R umsteigen wollen? SAS kostet Millionen, ist aber für ein Pharmaunternehmen nichts. Die Umstellung aller stabilen Berichtssysteme von SAS auf R würde jedoch das 50-100-fache kosten.

SAS hat ein phänomenales Support-System: Jedes Mal, wenn ich Hilfe brauchte, konnten sie diese innerhalb weniger Stunden bereitstellen.

Und was genau hat R, das SAS nicht hat: 1) bessere Grafiken ... ok, es ist eine große, aber Grafiken sind nicht alles. Außerdem kann mit R immer ein zusätzliches Tool zum Erstellen einiger cooler Grafiken verwendet werden, und SAS ist nicht schlecht, wenn es um Grafiken geht. 2) Moderne und effizientere Programmiersprache. Viele SAS-Benutzer sind keine Programmierer und möchten keine coole Sprache verwenden. Sie wollen nur in der Lage sein, die Daten zu analysieren.

Ich liebe R, aber es wäre verrückt für ein großes Unternehmen, auf SAS umzusteigen. Dies könnte jedoch für kleinere Unternehmen sinnvoll sein

Max C
quelle
3
Stimmen Sie zu, @Max. Endlich eine Antwort von jemandem aus der Branche. Es ist teuer, um
Dan
3
Das ist falsch. Die Kosten für die Programmierunterstützung für SAS sind viel höher als die für R. Unternehmen stellen Hoards von SAS-Programmierern ein, um die von SAS verwendeten archaischen Sprachen nachzuholen.
Frank Harrell
Ich bin in der Industrie und benutze beides. R kann Datenmanipulationen und, was noch wichtiger ist, Analysen mit viel weniger Zeilen durchführen und kann daher viel schneller entwickelt werden. Ich werde sagen, dass einige Pharmaunternehmen SAS-Systeme für die regulatorische Programmierung gründlich ausgebaut haben, die erfolgreich waren. Der Punkt berücksichtigt: Warum (an diesem Punkt) ändern? Wenn sie es von Grund auf machten, vielleicht R statt.
AdamO
11

Es gibt mehrere Hauptvorteile in keiner bestimmten Reihenfolge

  • SAS verfügt über eine große installierte Basis und eine lange Erfolgsgeschichte

Ich vermeide absichtlich die Verwendung abwertender Begriffe wie "Legacy" oder "Habit". Viele Unternehmen setzen SAS seit 30 oder 40 Jahren ein und haben Millionen von Zeilen Arbeitscode. Darüber hinaus bietet eine stabile Codebasis mit Millionen von Benutzertagen in einem Bereich, in dem kleine Fehler kritisch sein können, alle Vorteile. Dies ist der gleiche Grund, warum Unix-Aromen immer noch beliebt sind, obwohl Unix über 40 Jahre alt und in gewisser Weise veraltet ist. Schließlich gibt es eine große Community erfahrener SAS-Experten, die es gewohnt sind, geschäftliche Probleme zu lösen

  • SAS eignet sich gut für heterogene, komplexe Daten- und Betriebsumgebungen

Unternehmen verfügen über viele verschiedene Datenquellen, die auf unterschiedlichen Systemtypen sowie in vielen Fällen auf mehreren Betriebsumgebungen basieren. R verfügt erst seit kurzem über einige äußerst grundlegende Funktionen, mit denen mehr umgegangen werden kann, als im Speicher gespeichert werden kann. Vergleichen Sie dies mit der Fähigkeit von SAS, native, optimierte datenbankinterne Verarbeitung für Terradaten zu unterstützen, um nur ein Beispiel zu nennen. In den meisten Situationen der realen Welt ist der schwierigste Teil der Analyse der Umgang mit Daten und der Betriebsumgebung. (Müssen Sie den von Windows entwickelten Modellbewertungscode auf dem Mainframe ausführen? Mit SAS kein Problem. Mit R haben Sie Pech.) R löst keines dieser Probleme.

  • Der Benutzer muss sich keine Gedanken darüber machen, "auf sich allein gestellt" zu sein.

Ein SAS-Benutzer kann mit ziemlicher Sicherheit davon ausgehen, dass jedes Codemodul von qualifizierten Personen getestet wurde. Es ist nicht erforderlich, Zeit und Mühe aufzuwenden, um die Herkunft des Codes zu erlernen oder ihn unabhängig zu validieren. Wenn Probleme jeglicher Art auftreten, kann der Benutzer das Telefon abheben und Hilfe in Anspruch nehmen (von einfachen Informationen bis hin zu detaillierten Informationen zu unerwarteten Ergebnissen oder zum Verhalten einer ausgeklügelten Methode).

  • Es ist gut genug"

Die Sprache macht manche Leute aus, weil sie sich für die allgemeine Programmierung von modernen Sprachen unterscheidet. Trotzdem ist die Sprache auf hohem Niveau, kraftvoll, ausdrucksstark und umfassend. Kurz gesagt, sobald Sie es gelernt haben, erledigt es die Arbeit. Für Unternehmen ist die Eleganz der Lösung kein Verkaufsargument.

JBK
quelle
2
Eleganz vielleicht - aber kosten? Ich denke, Unternehmen interessieren sich dafür!
Wahrscheinlichkeitsrechnung
2
R kann auf allen Geräten, vom Mobiltelefon bis zum Supercomputer, zum Nulltarif und auch auf einem Großrechner zum Nulltarif ausgeführt werden.
Sean
9

Kundendienst.

Ich hatte einmal ein Gespräch mit einem Freund in einem Unternehmen, das sich auf die Installation von Servern spezialisiert hat, und er erklärte mir dann, warum große Unternehmen sich immer für Microsoft-Produkte entscheiden und nicht für Open Source. Der Vorteil, den Microsoft gegenüber seinen Open Source-Mitbewerbern hat, ist der Kundensupport. Wenn mit dem Produkt etwas schief geht, kann das Unternehmen Microsoft anrufen, große Unternehmen haben sogar persönlichen Support für sie. Nicht so bei Open Source Software.

Ich denke, das ist genau der gleiche Grund, warum SAS Vorrang vor R. bekommt.

Raskolnikov
quelle
2
Revolution R (oder andere Unternehmen)?
Ben Bolker
4
Ich denke, diese Kommentare sind nicht korrekt. In der Serverwelt gelten Open Source-Regeln, und der Apache-Webserver ist der beliebteste Webserver.
Frank Harrell
Ich habe nie gesagt, dass er über Server spricht. Eher über Produkte wie Microsoft Office. Ich erwähnte nur , dass er arbeitet in der Server - Welt.
Raskolnikov
2
Erinnert mich an Unternehmen, die einen Sharepoint und ein Open-Source-Wiki verwenden. Fast immer ist der Sharepoint unfruchtbar und nur das Wiki wird aktualisiert.
TLJ
9

Was ist mit Frontends? Was entspricht R für SAS Enterprise Guide, Web Report Studio oder Enterprise Miner? Bearbeiten: Mit diesen Tools kann ein Benutzer ohne Programmierkenntnisse ein DATA WAREHOUSE verwenden, ohne die zugrunde liegende Technologie zu kennen. Sie sind nicht in erster Linie Werkzeuge für den Einsatz von SAS als solchem. R-GUIs sind nur IDEs für die R-Sprache / das R-System AFAIK. Sie können keine Hilfe für nicht technische Benutzer bereitstellen, die Informationen und Einblicke vom DWH erhalten möchten.

Kurt
quelle
2
Es ist eine Antwort. Was SAS für Kunden (wie uns) so wertvoll macht, ist die Benutzerfreundlichkeit für Menschen, die keine einzige Codezeile schreiben müssen.
Kurt
2
@ Kurt, gung wollte nicht bedeuten, dass dies keine Antwort ist, sondern dass Ihre Antwort nicht auf diese Website passt (und speziell für die vorliegende Frage tatsächlich)
Stéphane Laurent
Es gibt Tonnen von GUIs für R, siehe stats.stackexchange.com/questions/5292/…
naught101
2
Nun, ich habe mit RStudio gearbeitet. Im Vergleich zu SAS Enterprise Guide ist es noch ein langer Weg, bis die Benutzerfreundlichkeit für Anfänger erreicht ist. Fügen Sie die Tatsache hinzu, dass in R ein Äquivalent zum Metadaten-Server fehlt. Und ich vermisse ein sofort einsatzbereites Äquivalent für WRS (vielleicht bin ich blind :)). Die Schönheit einer Sprache und die Produktivität, die Sie erzielen können, sind für Unternehmen so gut wie nichts, bei denen 90% der Data-Warehouse- "Kunden" in keiner Programmierumgebung "Hello World" schreiben konnten. Darauf wollte ich hinweisen, und da bleibt noch viel Arbeit zu tun.
Kurt
2
Vielen Dank für die Aktualisierung Ihrer Antwort, @ Kurt. Ich denke, es wird für zukünftige Leser jetzt nützlicher sein. Es ist richtig, dass es Point & Click- und Data Warehouse-Angebote für SAS gibt, die umfassender und sofort einsatzbereit sind als R-Angebote. Dies ist ein vernünftiger Punkt. +1
gung
8

Ich habe einmal für ein Beratungsunternehmen gearbeitet, das SAS bei einem großen Chiphersteller im Silicon Valley unterstützt hat. Unser Ansprechpartner in der Firma teilte uns mit, dass er von einer anderen Firma das Angebot erhalten habe, genau die gleiche Beratung zu erhalten, indem er eine andere Software verwendete, die alle von SAS abgedeckten Bereiche abdeckte und die die Firma einen Bruchteil dessen kosten würde, was SAS ihnen berechnete ( 30.000 USD im Gegensatz zu 1.000.000 USD ). Die Kontaktperson überlegte, was zu tun sei, und entschied sich dagegen, ihren Chef über das Angebot zu informieren, da sie befürchtete, überhaupt wegen der Verwendung von SAS entlassen zu werden und keine billigeren Alternativen in Betracht zu ziehen. Stattdessen bestand er darauf, dass unsere Beratungsfirma ihrem Unternehmen einen großen Bruch in unserer Beratungsgebühr gibt. Unsere Firma stimmte zu.

sAV
quelle
1
Ihr Ansprechpartner konnte also nicht argumentieren, dass R im Vergleich zu SAS noch relativ neu ist, und er wollte warten, um sicherzustellen, dass R eingerichtet wurde, bevor er es verwendet?
Wahrscheinlichkeitsrechnung
6

Ich glaube nicht, dass die Anwendungssicherheit erwähnt wurde. Diese Frage wurde in Stack Overflow aufgeworfen, aber gelöscht, da sie nicht zum Thema gehörte.

Ich arbeite mit der schwedischen Gesundheits- und Sozialbehörde zusammen, die SAS einsetzt. Wenn ich mit ihren Statistikern sprach (die R mögen), behaupten sie, dass ihre IT-Leute SAS bevorzugen, da sie den in R heruntergeladenen Paketen nicht vertrauen. Meine Frau arbeitet auch in SAS und ihre Institution behauptet oft dasselbe Problem ...

Ich würde gerne einige Kommentare zu diesem Thema sehen. Ich habe eine schnelle Suche durchgeführt, aber keine guten Referenzen gefunden ...

Max Gordon
quelle
3
Was ist die Alternative zum Herunterladen eines Pakets, das neue Funktionen bietet (wie die meisten R-Pakete)? Ist es zu Hause diese Fähigkeiten wachsen? Ist das zuverlässiger?
Frank Harrell
2
@FrankHarrell Ich stimme zu, aber ich denke, dies könnte ein einfacher Bereich für die R-Entwickler sein, um Ziele zu erreichen und Verbesserungen vorzunehmen. Eine einfache Lösung könnte verschiedene Sicherheitsstufen für Pakete sein - wenn ein Paket einen Systemaufruf hat oder sich selbst mit dem Internet verbindet, sollte das Paket eine höhere Sicherheitsstufe haben. Dies könnte Installationen mit nur geringer Freigabe in Einrichtungen / Unternehmen ermöglichen, bei denen ein Datenleck von größter Bedeutung ist. Ich als Benutzer könnte dann auch eine zusätzliche Prüfung durchführen, wenn ich mich für die Installation eines Pakets mit hoher Freigabe entscheide. (Übrigens, wann ist Ihr Buch (RMS Version 2) geplant?)
Max Gordon
Ich hoffe, dass die 2. Ausgabe von RMS in etwas mehr als einem Jahr verfügbar sein wird.
Frank Harrell
5

Der Grund, den ich als am überzeugendsten empfand, war, dass SAS über eine umfangreiche Bibliothek vertikaler geschäftsspezifischer Module verfügt, die von allen Mitarbeitern in diesen Branchen verwendet werden.
Aber auch, dass SAS auf die Bedürfnisse dieser vertikalen Segmente im Geschäftsleben eingegangen und diese optimiert hat - optimiert im Sinne von "Benutzer müssen nicht viel zusätzliche Arbeit leisten, um die Ergebnisse zu erzielen". Ich bin kein SAS-Benutzer, daher ist dies keine voreingenommene Verteidigung der SAS-Geschäftsstrategie.

Nitin
quelle
4

Als das große kommerzielle Produkt von SAS bemühen sich die bezahlten Verkäufer nachdrücklich und koordiniert, das Produkt zu bewerben. Ich denke nicht, dass die Bemühungen, die Verwendung von R zu fördern, mit diesen übereinstimmen können.

Itamar
quelle
8
Ja, die Leute haben bis zu einem gewissen Grad entdeckt, dass R an ist. Ein Großteil des Problems beruht jedoch auf der Trägheit, eine neue Sprache zu lernen. Es werden immer neue Sprachen herausgebracht, die Vorteile gegenüber älteren Sprachen haben, die Benutzer jedoch an den alten Sprachen festhalten (Zeuge COBOL). Das Programmieren in SAS ist äußerst ineffizient und erfordert möglicherweise die doppelte Anzahl von Programmierern, um die gleiche Arbeit wie in R zu verrichten, aber SAS-Experten machen sich gerne auf die lustige Art und Weise an die Arbeit, und Unternehmen haben Angst vor der Art von Unterbrechung, die ihnen Millionen von Dollar ersparen würde in Gehälter.
Frank Harrell
3

Ich sehe Open Source oder lizenzierte Software wie diese, sei es SAS oder irgendetwas anderes. Meine IT-Abteilung ist da, um einen Service für unser Geschäft bereitzustellen. Das Unternehmen verdient kein Geld mit der IT, sondern nur mit dem von der IT unterstützten Geschäft. Das Unternehmen erwirtschaftet einen Jahresumsatz von 16 Milliarden US- Dollar. Die IT-Kosten betragen rund 200 Millionen US- Dollar pro Jahr. Wenn es um Geld ginge, würde ich die Kosten senken, aber wenn ich 10% ( 20 Millionen US- Dollar) meines Budgets einspare , wird das Unternehmen das bemerken? Werden sie nächstes Jahr nur mein Budget reduzieren? Wenn die IT ausfällt, verliert das Unternehmen Einnahmen, die sich je nach Art des Ausfalls unterscheiden. Teile des Geschäfts können keine Einnahmen mehr erzielen. Wenn ein Produkt wie SAS ausfällt, kann ich unter einem Vertrag klagen. Wenn ein OSS-Produkt ausfällt, kann ich nicht. Ich werde meine $ nicht zurückerhalten16 Milliarden, aber ich kann einige zurückbekommen, und realistisch mit SAS, werden Sie wahrscheinlich nicht das Los verlieren. Der Unterschied zwischen Preis und Kosten muss jedes zusätzliche Risiko für das Unternehmen rechtfertigen. Manchmal ist es billiger, bei SAS zu bleiben, als umzuschulen. Manchmal gibt es Probleme mit höherer Priorität, sodass Unternehmen bei SAS bleiben. Einige Unternehmen benötigen nicht die volle Funktionalität. In diesem Fall sind Alternativen möglich. Einige brauchen die Unterstützung nicht und wieder sind die Alternativen realisierbar. Wenn Sie die Geschäftsanforderungen erfüllen, sind beide Optionen gültig. Wenn Sie Unterstützung für ein Unternehmen bereitstellen möchten, müssen Sie die Gesamtbetriebskosten über einen Zeitraum von 5 bis 10 Jahren, die Fähigkeit, Experten für die Tools zu rekrutieren, sowie die Stabilität des Produkts berücksichtigen Sie müssen also nicht bei jeder neuen Version alles neu schreiben.

Bruce Rei
quelle
4
Ich folge deiner Argumentation nicht. Die Menge an Geld, die für das Programmieren in einer archaischen Sprache (SAS) im Vergleich zu modernen freien Sprachen aufgewendet wird, ist atemberaubend.
Frank Harrell
4
@Frank - Ich muss Ihrer Charakterisierung widersprechen. Ein kompetenter SAS-Programmierer kann in SAS sehr produktiv sein, und kompetente SAS-Programmierer sind weit verbreitet. Ich gebe Ihnen zu, dass R mehr wie eine moderne Sprache aufgebaut ist und daher für Programmierer, die beispielsweise Java kennen, möglicherweise einfacher zu erlernen ist. Nach meiner Erfahrung in vielen Unternehmen ist die Entwicklerproduktivität mit SAS selten ein wesentliches Problem.
JBK
9
Nachdem ich SAS 23 Jahre lang und S-Plus / R 22 Jahre lang verwendet habe, kann ich sagen, dass ein erfahrener SAS-Programmierer hochproduktiv sein kann, ein erfahrener R-Programmierer jedoch problemlos dreimal so produktiv sein kann.
Frank Harrell
2
"Ich kann unter Vertrag klagen" haha ​​- falscher Code, der von Mitarbeitern geschrieben wurde, verursacht mit größerer Wahrscheinlichkeit Probleme als etwas, das SAS oder R "alleine" macht
Wahrscheinlichkeitsanalyse
1

Einige Gründe, die ich nicht erwähnt habe:

  1. Bessere Dokumentation. SAS-Dokumentation ist ausführlich, R-Dokumentation ist knapp. Viele Unternehmen bevorzugen möglicherweise eine ausführliche Dokumentation.

  2. Bessere Fehlermeldungen. Rs Fehlermeldungen scheinen oft zu beweisen, dass die Person, die die Nachricht schreibt, schlauer ist als die Person, die sie liest.

  3. Technischer Support. SAS bietet den besten technischen Support, den ich jemals erlebt habe, und zwar von SAS. Sie können Hilfe zu R erhalten, aber diese Hilfe ist auf verschiedene Stellen verteilt und nicht immer verfügbar. Die Leute auf den verschiedenen Websites, die Hilfe bei R anbieten, sind Freiwillige - und Freiwillige sind nicht verpflichtet zu helfen. Die Mitarbeiter des technischen Supports von SAS werden dafür bezahlt, das zu tun, was sie tun - und das tun sie auch. Sie machen es nicht nur gut, sie machen es auch höflich - eine Eigenschaft, die oft nicht in allen R-Communities vorhanden ist.

  4. Einfache Koordination mit Word und Excel. Ja, ich weiß, dass Sie R dazu bringen können, dies zu tun, aber mit SAS ist es einfacher (andererseits funktioniert R besser mitLEINTEX

Peter Flom
quelle
1
Ich bin mir sicher, dass es Firmen gibt, die technischen Support für R verkaufen. Aber wie gut, dass ich keine Erfahrung habe!
kjetil b halvorsen
1

Ich denke, der alte Winkel kann aus folgendem Grund sehr groß sein. Eine Organisation stellt eine Person ein, nennt sie Person X. Sie sind ein Computer-Guru / Zauberer / etc. Sie bauen großartige SAS - Programme / Tools / etc. Sie sind so gut, dass andere Mitarbeiter der Organisation nicht das Gefühl haben, die Funktionsweise der Programme verstehen zu müssen. Sie machen es so einfach, nur einen Knopf zu drücken, und alles funktioniert einfach (die magischen schwarzen Kästchen).

Person X verlässt die Organisation. Leider verlässt das Wissen der Person X die Organisation (Dokumentation und Wissensmanagement wurden nicht priorisiert, stattdessen Arbeitsprogramme). Sie werden durch Person Y ersetzt. Person Y ist großartig für R, hat jedoch keine Ahnung von SAS und daher auch keine Ahnung davon, wie die SAS-Programme tatsächlich funktionieren. Es gibt eine riesige Lernkurve, um das auszugleichen was passiertCTCTist deutlich höher als eine einjährige Lizenz für SAS. Ich gehe davon aus, dass SAS eine Analyse dieses Kompromisses vornimmt und dies Einfluss darauf nimmt, wie die Lizenzgebühr festgelegt wird (also, wenn ich bei SAS arbeiten würde). Beachten Sie auch, dass SAS-Plotverfahren weitaus besser sind als noch vor einem Jahrzehnt (z. B. proc sgplot vs proc plot). Zufall, dass R zuerst gut geplottet hat? Ich denke nicht! Dies verringert effektiv die Effizienz beim Umschalten, da das Plotten nicht mehr so ​​unterschiedlich ist - R ist immer noch besser, aber nicht genug, um umzuschalten ...

Wahrscheinlichkeitslogik
quelle
0

Für die Industriestatistik gibt es Qualitätssicherungsmitarbeiter, die (normalerweise) keine Programmier-, Statistik- oder naturwissenschaftlichen Kenntnisse besitzen und Statistiker, Programmierer und Wissenschaftler auditieren. Sie wollen wissen: "Woher weißt du, dass das, was du tust, richtig ist?" und "Wenn es falsch ist, wie können wir jemandem die Schuld geben und wie werden sie dafür bezahlen?".

Die GNU / GPL Copyleft-Lizenz wird mit dem Text "R ist freie Software und kommt absolut ohne Garantie" in Text mit Großbuchstaben geliefert, genau wie ich es geschrieben habe. Das ist anstößig. Wenn eine gute Person diesen Text liest, diskreditiert sie R grundsätzlich direkt. Ich meine, wenn ein Produkt gut ist, lohnt es sich, eine Garantie hinzuzufügen, oder? Solche kommerziellen Produkte haben uns zum Glauben gebracht. Tatsächlich war es letztendlich die FDA, die versprach, Zulassungsanträge in R zu akzeptieren, was eine Veränderung in der Softwareindustrie widerspiegelte. (Beachten Sie, dass diese Aussage nach dem ursprünglichen Buchungsdatum der Frage liegt.)

Für jemanden, der nichts über Computer weiß, sind die vorgestellten Szenarien von Sicherheit, Irreproduzierbarkeit und schwerwiegenden wissenschaftlichen Fehlern aufgrund dieser ABSOLUT GARANTIEVERLUST unbegrenzt. Wir sind uns alle einig, dass Fehler katastrophale Kosten verursachen können. Für Ihre SAS-Lizenz verfügt SAS über Experten, die Auditoren ihre Software erläutern können. In dem unmöglichen Szenario, in dem SAS tatsächlich ein solches Problem verursacht, sind sie für Geldstrafen und Bestrafungen verantwortlich (sie haben auch genug Geld für Anwälte, um dies sicherzustellen) vollständig entlastet werden). Der Aufwand und die Kosten dafür, dass ein Analyst / Programmierer diesen Fall für R vorlegt, belaufen sich im Wesentlichen auf eine SAS-Lizenz. Das Programmieren in SAS befreit Sie jedoch nicht vollständig von der Last der Qualitätssicherung!

Grundsätzlich würde ich sagen, dass Rechtsstreitigkeiten eine herausragende Rolle bei der Notwendigkeit einer kostspieligen Lizenzsoftware gespielt haben.

AdamO
quelle