Symbolische Computeralgebra für Statistiken

8

Welche Funktionen sollten in einem CAS vorhanden sein , der speziell auf Statistik ausgerichtet ist?

Symbolische Algebra-Systeme wie Mathematica und Maple werden häufig für Kalkül-, Logik- und Physikprobleme verwendet, jedoch nur selten für Statistiken. Warum ist das?

Welche statistischen Konstrukte könnten einem symbolischen Algebra-System hinzugefügt werden, um seine Verwendung in diesem Bereich zu verbessern? Was sind einige spezifische Codebeispiele, die viele Leute gerne machen würden?

Denken Sie bitte an die folgenden drei Benutzer: Forschungsstatistiker, Nicht-Statistikforscher, der Statistiken in einem anderen Bereich (z. B. Biologie) verwendet, Statistikstudent.

Ich werde in den nächsten Monaten am Statistikcode von SymPy arbeiten und möchte Eingaben für die gewünschte Funktionalität einholen. Die Dinge, die ich benutze, sind nicht unbedingt das, was die breitere Community benutzt.

MRocklin
quelle
Es gibt ein Paket für Statistiken, siehe R-Projekt für statistische Berechnungen ( r-project.org ).
Roman Luštrik
1
Ja, R eignet sich hervorragend für Statistiken. Es ist jedoch in der Regel auf hauptsächlich numerische Berechnungen spezialisiert. Ich bin daran interessiert, was wir tun können, um Forschern bei symbolischen Manipulationen zu helfen.
MRocklin
2
Es ist nicht offensichtlich, dass einem dieser symbolischen Systeme "statistische Konstrukte" hinzugefügt werden müssen. Mathematica hat in Release 8 viel davon getan, aber es wird wahrscheinlich immer noch keine beliebte Plattform für angewandte Statistiken oder Studenten. Ein Grund dafür ist, dass eine gute Statistiksoftware die nicht-mathematische Arbeit viel besser unterstützt als die Mathe-Software: Dateneingabe, Verwaltung, Transformation, Abfrage und Dokumentation. Die Statistiksoftware unterstützt normalerweise auch eine große Galerie von Datenvisualisierungsmethoden.
whuber
2
Ich bin mir nicht sicher, warum Sie glauben, dass CAS in Statistiken selten verwendet wird. persönlich benutze ich Mathematica die ganze Zeit. Casella & Berger hat sogar einen Anhang zu Mathematica. Aber als Statistiker verbringe ich im Allgemeinen mehr Zeit mit Daten als mit Mathematik, wie @whuber betont.
JMS
2
Beachten Sie auch, dass viele (die meisten?) Akademischen Forscher und Studenten über Uni-Maschinen und / oder Standortlizenzen freien Zugang zu ausgereiften Paketen wie Maple und Mathematica haben.
JMS

Antworten:

9

Unterstützung für Matrixalgebra. Die überwiegende Mehrheit der praktizierten Statistiken ist multivariat und umfasst Matrizen. Oft erfordert die Vereinfachung von Matrixformen spezielle Regeln, die nicht einfach aus einem univariaten Fall übersetzt werden können. Daher wäre eine gute Matrixunterstützung sehr hilfreich.

user2839
quelle
2
Darin ist Mathematica bereits gut.
whuber
Hervorragender Punkt. Was könnte zu einem System hinzugefügt werden, das die lineare Algebra bereits gut ausdrückt? Oder reicht ein fester Ausdruck von Matrizen aus?
MRocklin
1
@MR Anstatt zu fragen, was zu diesen Systemen hinzugefügt werden könnte, überlegen Sie, warum Sie dies tun. Für wen? Welchen Nutzen möchten Sie unterstützen? Was sind die zwingenden Gründe (falls vorhanden), einem symbolischen System statistische Verfahren hinzuzufügen? Mit anderen Worten, beginnen Sie mit einer guten Funktionsspezifikation.
whuber