Welche Statistiksoftware eignet sich für das Unterrichten eines sozialwissenschaftlichen Einführungskurses in die Statistik?

11

Ich suche ein Statistik-Softwarepaket, das ich in einem Einführungskurs in die Statistik für ein sozialwissenschaftliches Studienprogramm verwenden kann. Die Studierenden haben keine statistischen Vorkenntnisse und auch keine Erfahrung mit Programmiersprachen. Ziel ist es, ihnen grundlegende statistische Konzepte (als Mittelwerte, Varianz, Summe der Quadrate, p-Werte usw. und schließlich lineare Regression) vorzustellen und sie in die Lage zu versetzen, anhand von Beispieldatensätzen selbst grundlegende Analysen durchzuführen. Der Kurs sollte sich mit Lernkonzepten befassen, indem Statistiken erstellt werden, anstatt Formeln auswendig zu lernen (obwohl ich Formeln für wichtig halte).

Daher suche ich nach einer Alternative zur üblichen Syntax (als normales R) oder einer Point-and-Click-Software (als SPSS oder Rcmdr). Die Software sollte leicht zu erlernen sein und über eine übersichtliche grafische Benutzeroberfläche verfügen, die Datensätze visualisiert und die Standardgrafiken und -tabellen bietet. Am besten wäre es, wenn alle verschiedenen Schritte einer Analyse visualisiert würden (z. B. Lesen und Bearbeiten von Daten, Berechnung von beschreibenden Maßen, Erstellen von beschreibenden Tabellen und Diagrammen, Berechnung von Inferenzmaßen, Zeichnen von Inferenzgraphen, Export in einen Bericht).

Haben Sie Vorschläge für (Open-Source- oder kostenlose) Statistiksoftware, die zum Lernen und ersten Üben von Statistiken geeignet ist?

BEARBEITEN
Vielen Dank für Ihre Vorschläge. Ich habe mich mit gretl und zwei anderen Programmen befasst, die ich während meiner eigenen Online-Anfrage gefunden habe: RapidMiner und Statistical Lab . [1]
Ich habe festgestellt, dass gretldie Benutzeroberfläche und die Ausgabe klarer und fokussierter sind als z. B. Rcmdr, SPSS oder Stata. Daher ist es aus meiner Sicht ein gut qualifiziertes Instrument, um mit dem Unterrichten von Statistik zu beginnen.
Die GUI des Flussdiagramms von RapidMinerundStatistical Labbeeindruckte mich, als sie die einzelnen Schritte einer statistischen Analyse visualisierten (beginnend mit dem Laden von Daten). Ich denke, dies könnte für viele Studenten hilfreich sein, die mit dem üblichen Fokus auf mathematische Erklärungen zu kämpfen haben. Natürlich scheint mir RapidMiner mit Funktionen, Menüs und Schaltflächen für Anfänger zu überladen zu sein, während das statistische Labor viel fokussierter ist. Das große Plus des Statistical Lab ist der konsolenähnliche "R-Calculator" mit einem "R-Code-Assistenten", der bei der Erstellung einer echten R-Syntax hilft, auf die sich das Statistical Lab Rfür seine Berechnungen stützt .
Schließlich beschloss ich, im ersten Semester mit dem Statistical Lab zu beginnen, während ich die Grundkonzepte vorstellte und zu RStudio wechselte vorstellte und im zweiten Semester (und Rcmdr) wechselte.

[1]: Gnumeric, SciPy, Scilab, GNU Octave und andere scheinen mir weniger sozialwissenschaftlich ausgerichtet zu sein.

nicht numerisches_argument
quelle
8
@Matthias: Ich denke, wenn Ihre Schüler aus einem sozialwissenschaftlichen Bereich kommen / darauf abzielen, ist es ein Overkill, ihnen R als ersten Schritt in der Statistik beizubringen. Die meisten von ihnen haben Probleme mit dem Konzept von Konsole, Befehlen, Syntax usw. und Sie werden mehr Zeit damit verbringen, "Programmierkonzepte" (was ist "Funktion", "Schleife" usw.) als "Statistik" durchzugehen. Ich stütze mich dabei auf frühere Erfahrungen, als ich Tutorials für eine Statistik 101 in einer Soc.Science-Abteilung gemacht habe. Die Leute haben den Punkt der Vorlesungen verpasst, weil sie sich mehr darauf konzentriert haben, R für sie arbeiten zu lassen, als ihre Daten tatsächlich zu untersuchen.
usεr11852 sagt Reinstate Monic
1
@ user11852: Sie haben vielleicht Recht, aber es ist traurig, dass High Schools Schüler ohne Programmierkenntnisse aussenden. Oder Universitäten, die diese Lücke zulassen. Es sollte kein Student zu einer Universitätsklasse kommen, der nicht weiß, was eine Schleife oder Funktion ist. Wenn Sie die Belichtung verzögern, wird das Problem nur an eine andere Stelle verschoben.
neugierige Katze
2
@ user11852: Die andere weniger schmackhafte Option könnte darin bestehen, dass Satistikabteilungen darauf bestehen, dass "Stats 101 for Social Sciences" -Klassen die Voraussetzung für Programmiererfahrung oder eine Abhilfeklasse für Programmierung sind. In diesen Tagen, in denen fast alle Fächer so stark rechnerisch voreingenommen sind, gibt es wirklich keinen Grund, warum Programming-101 nicht die allererste Klasse sein sollte, die jeder besucht.
neugierige Katze
6
Für das, was es wert ist, habe ich R erfolgreich in meinem Einführungsstatistikkurs für Politikwissenschaft eingesetzt. Ich habe RStudio verwendet . Ich hatte auch wöchentliche "Labore", in denen ich den Schülern erlaubte, gemeinsam an kleinen Aufgaben zu arbeiten, während ich herumging und Fragen beantwortete. Mit einem gut kommentierten Beispielcode haben sich die Schüler gut geschlagen und sich kaum beschwert. Sie haben sich tatsächlich viel weniger über R beschwert als im letzten Semester, als ich Stata benutzte. Da Stata nicht frei ist, mussten die Schüler für Laborstunden kommen, um ihre Arbeit zu erledigen - sie hassten es.
Jason Morgan
6
Ich denke, dass R in Verbindung mit RStudio ein ausgezeichneter Ansatz sein kann. Im Gegensatz zu Menüsystemen schafft es auch die Voraussetzungen für eine reproduzierbare Forschungspraxis. Ich würde empfehlen, mehrere Codevorlagen herauszugeben, die die Schüler aus dem Internet in RStudio laden können (RStudio macht dies einfach), und die Schüler die Aufgabe übernehmen zu lassen, Variablennamen und statistische Modelle so zu ändern, wie es für das jeweilige Problem erforderlich ist.
Frank Harrell

Antworten:

12

Vielleicht Gretl? http://gretl.sourceforge.net/

Es ist kostenlos und wird an unserer Universität für die Statistik von Studenten verwendet.

Stat Tistician
quelle
9
+1. Hervorragender Vorschlag. Ich fand Gretls GUI immer intuitiv und auf den Punkt und das Feedback, das es liefert, genau und ohne allzu viel Schnickschnack, was einige weniger "technische" Studenten abschrecken würde. Außerdem ist es kostenlos, gut dokumentiert und verfügt über eine R-Konsole, wenn jemand Lust hat, etwas "Tieferes" zu sehen.
usεr11852 sagt Reinstate Monic
8

Ich würde die meisten "berühmten" Sachen vermeiden, MatLab , Maple , Mathematica , JMP , SAS oder Minitab , denn wenn Ihre Studenten ihren Abschluss machen, müssen sie Tausende von Dollar pro Jahr bezahlen, um sie professionell zu nutzen. Jedes Unternehmen hat in der Regel sein eigenes Lieblingswerkzeug. Wenn Sie ihm ein Werkzeug beibringen, für das sein Unternehmen nicht bezahlt, werden seine Fähigkeiten verschwendet. Ich mag auch die proprietären Bibliotheken nicht - sie schulen Benutzer darin, Tasten zu drücken, und wenn der Benutzer woanders hingehen möchte (JMP oder was auch immer), gibt es keine Übertragung des Lernens.

Python mit SciPy / NumPy ist ziemlich gut. Es ist Open Source und wird gut unterstützt. Es hat eine lernbare / einfache Grammatik. Es wird immer noch so interpretiert, dass es nicht schnell schreit, aber wenn sie keine Skripte oder Tabellen kennen, ist es viel schneller als jemals zuvor. PythonXY ist eine gute Version, hat gute Bibliotheken und Unterstützung. Ich mag auch, dass GUI-Programmierung dadurch möglich ist. Das Erstellen von eigenständigen Anwendungen in Fenstern ist eine kleine Herausforderung, liegt aber wahrscheinlich über dem Niveau Ihrer Schüler. (bearbeiten) Sage und verbessere das Wertversprechen von Python erheblich. Die Benutzeroberfläche und die Benutzerfreundlichkeit werden erheblich verbessert. Ein kompilierter Code, der 1000x schneller ist als ein ziemlich gut interpretierter Code, klingt für mich großartig (oder erstaunlich).EDIT: Ich hatte Spaß mit der Anaconda Cython Distributionen (auch bekannt als Conda), und sie sind auch sehr einfach zu bedienen.

Ich bin kein großer Fan von Perl . Es ist etwas veraltet. Es geht mehr um das Parsen und Verarbeiten von Text als um Mathematik / Naturwissenschaften. Versteh mich nicht falsch, es kann Mathe / Naturwissenschaften machen, aber wenn du VBA kennst, kann MSWord Mathe / Naturwissenschaften machen. In der Lage zu sein, ist nicht dasselbe, hat einen bestimmten Job als Hauptaugenmerk.

Ich mag R. , obwohl Sie es nicht tun, weil es von qualifizierten Doktoranden in Mathematik / Statistik aggressiv entwickelt wird. Dies bedeutet, dass die Grammatik, obwohl sie klug ist, über Bibliotheken verfügt, die auf dem neuesten Stand sind und sich als fehlerfrei erwiesen haben. (Allgemein)

Excel ist kein schlechter Start. Sobald Sie eine Tabelle kennen, wird die Verwendung einer anderen einfacher. In einem Geschäftsumfeld verfügt fast jedes Unternehmen über ein MicroSloth- Büro, sodass Excel keine schlechte Idee ist. Ich mag ihre Skripte nicht, aber das ist nur eine Vorliebe, ich kann sie trotzdem verwenden. Es kostet ungefähr 150 US-Dollar im Vergleich zu 5000 US-Dollar für einige der anderen Software, so dass die Eintrittskosten für normale Leute vernünftiger sind.

JMP-Skript ist fremd. Es wird nicht in andere (nonSAS) Software übersetzt. Bleib weg davon. Das einzige einlösbare Merkmal der Sprache ist, dass sie (in einem begrenzten Sinne) "R" -Code ausführen kann. Wenn Sie in "R" codieren, verwenden Sie einfach "R" und "RStudio".

Ich habe MathCAD nicht verwendet, daher kann ich nicht auf seine Relevanz eingehen . Ich denke, es ist mehr symbolisch, weniger über den Import externer Daten. Bisher ist es billiger. Es ist nicht frei und offen. Die Einrichtung wird nicht in eine andere Sprache übersetzt. ( EDIT ) Ebenfalls in dieser Kategorie befindet sich EES , von dem ich außerhalb eines sehr engen Nutzungsfensters ebenfalls nicht beeindruckt bin.

EDIT : Ich war ein wenig beeindruckt von LabVIEW . Es ist einfach genug zu bedienen, dass ein paar Stunden jemanden fähig machen können. Es läuft sehr schnell, wie buchstäblich 1000x schneller als MatLab für buchstäblich das gleiche ( MathScript Code ). Wenn Sie etwas schweres Heben haben, ist es eine kleine Überlegung wert. Es kostet Geld, aber etwas in der Nähe von 1/5 des herkömmlichen Big-Eisens.

Viel Glück

BEARBEITEN: Ich würde Statistical LAboratory nicht verwenden, da es selbst bei Auswahl von "Englisch" für die Sprache auf Deutsch angezeigt wird und unter Windows 7 nicht deinstalliert wird. Beide administrativen Schwachstellen machen es für mich zu einem No-Go. Ich kann es nicht bedienen, und als ich versuchte, es zu entfernen, schlug dies fehl.

Durch Versuch und Irrtum entdeckte ich die Menüeinstellung, damit sie auf Englisch angezeigt wird. Es scheint eine relativ einfache (und daher nützliche und konsistente) Schnittstelle zu einigen R-Bibliotheken für die Datenverarbeitung und -anzeige zu sein. Ich werde mehr darüber nachdenken müssen, also ist an diesem Punkt "die Jury immer noch nicht da".

BEARBEITEN Sie mehr:

-> Hier <- ist ein lustiger Link zu einer ganzen anderen Diskussion über Werkzeuge und Werkbänke.

EngrStudent - Monica wieder einsetzen
quelle
2
Es gibt auch RPy rpy.sourceforge.net , R als Bibliothek für Python, sodass Sie mit der syntaktischen Einfachheit von Python die aktuellen, nachweislich fehlerfreien Aspekte von R erhalten.
Ghillie Dhu
1
"Sie schulen Benutzer darin, Knöpfe zu drücken, und wenn der Benutzer woanders hingehen möchte (JMP oder was auch immer), gibt es keine Übertragung des Lernens." SAS, ein proprietäres Programm, ist nicht besonders gut für das "Drücken von Tasten" geeignet, und Probleme beim Übertragen zwischen verschiedenen Sprachen sind kaum ein Merkmal von proprietärer Software allein. Heck, ich war mehr zu Hause von SysStat zu JMP als von Python zu R.
Fomite
@Epigrad - Ich sehe zu, wie Ingenieure die ganze Zeit das Gehirn ausschalten. Dutzende und Dutzende von Leuten. Ich bin froh, dass Sie einen Nutzen dafür gefunden haben, aber ich gehe davon aus, dass Sie ein Ausreißer sind und die allgemeine Tendenz des Schadens durch Ihre Erfahrung nicht wesentlich verändert wird.
EngrStudent
@EngrStudent: Vielen Dank für Ihre Bemühungen, Statistical Laboratory auszuprobieren! Die Menüeinstellung für die englische Sprache ist zwar nicht intuitiv, aber nachdem ich sie einmal eingestellt habe, bin ich nicht mehr auf Probleme mit der Sprache gestoßen. Leider kann ich den "R-Graph-Assistenten" nicht zum Laufen bringen, obwohl der normale R-Graph gut funktioniert, wenn ich einen R-Code eingebe. Daher werde ich meinen Schülern einige Beispielcode-Schnipsel geben, um grundlegende Grafiken zu erstellen. Vielleicht
wechsle
1

Sie können versuchen, Gnumeric zu verwenden, eine hoch angesehene Tabelle. Es gibt auch eine Open Office-Tabelle. Vorausgesetzt, Sie erklären die Fallstricke der Verwendung von Tabellenkalkulationen, insbesondere von Excel, nach dem College in ihrem späteren praktischen Leben haben sie möglicherweise nicht den Luxus von etwas wie SPSS, könnten aber dennoch einen nützlichen Service von diesen kostenlosen Produkten erhalten, die keine allzu hohen Anforderungen an Mathematik und Programmierkenntnisse stellen . Viele Büroumgebungen enthalten standardmäßig Excel.

Schauen Sie sich an:

http://groups.google.com/group/sci.stat.math/browse_thread/thread/26fe9a9a0d91139d# - Statistik und Excel 2007

und suchen Sie nach ähnlichen Referenzen wie

http://groups.google.com/group/comp.soft-sys.stat.spss/browse_frm/thread/3940bcd6c6266f1b/d85edd4978e53568?hl=de#d85edd4978e53568 Keeling, Kellie B. & Pavur, Robert J. (2007). Eine vergleichende Studie zur Zuverlässigkeit von neun statistischen Softwarepaketen. Computational Statistics & Data Analysis, 51, 3811–3831.

Robert Jones
quelle
1

Ich war CalEst . Die Lizenz ist billig, wie 10 Dollar und bietet sowohl Berechnungen / Grafiken als auch großartige Simulationen / Aktivitäten für die Schüler zum Üben. Darüber hinaus haben sie auf ihrer Website einige Tools, hauptsächlich für Distributionen, die Sie vielleicht nützlich finden.

Octavio Duran
quelle
Diese Antwort ist etwas kurz. Können Sie etwas mehr darüber erzählen, warum Sie diese Software vorschlagen und welche Vorteile sie im Vergleich zur Konkurrenz hat?
kjetil b halvorsen
1

Wir haben begonnen, Rguroo zu verwenden. Diese Software ist neu veröffentlicht. Es basiert auf R, es sind jedoch keine Kenntnisse der R-Codierung erforderlich. Es ist auch eine Webanwendung, sodass Sie sich einfach in einem Browser anmelden können. Meine Schüler können ihre Arbeit jederzeit speichern und zurückkehren, um ihre Arbeit abzuschließen. Die grafische Benutzeroberfläche ist sehr intuitiv und die Ausgaben sehen gut aus.

Marie
quelle
0

Wir verwenden die Beta-Version von Rguroo seit drei Jahren in unseren Einführungskursen für Statistik an der California State University in Fullerton. Sie haben jetzt (August 2019) eine offizielle Version veröffentlicht, siehe https://Rguroo.com. Dies ist eine Statistiksoftware für Webanwendungen, die in jedem Browser funktioniert. Diese Software wurde für den Unterricht entwickelt und bietet Einzelunterricht und Schulung für die Fakultät. Senden Sie einfach eine E-Mail oder rufen Sie sie an, um eine Demo zu vereinbaren. Die Software führt R im Hintergrund aus, aber Sie müssen R nicht kennen, es ist alles Zeigen und Klicken. Es verfügt über viele großartige Funktionen, einschließlich detaillierter Ausgaben, großartiger Grafikwerkzeuge, Wahrscheinlichkeitsrechner und Simulationswerkzeuge. Besonders gut gefallen mir die Reproduzierbarkeitsfunktionen, mit denen Sie Ihre Arbeit jederzeit speichern und dort zurückkehren können, wo Sie aufgehört haben. Sie können Ihre Arbeit auch über sogenannte RGR-Dateien mit den Schülern teilen. Fazit ... es ist großartig und wir verwenden es weiterhin.

Mori J.
quelle
0

Ich persönlich benutze die DataMelt-Software zum Unterrichten von Statistiken. Es ist sehr gut dokumentiert, es enthält Tutorials, Bücher und viele Beispiele. Wichtig ist auch, dass man nach jedem Beispiel suchen kann und eine vernünftige Antwort erhält (in Javadoc und Code-Snippets). Die Schüler können nicht nur Python (die Standardprogrammiersprache) lernen, sondern auch das Codieren statistischer Methoden in Java. Meiner Ansicht nach ist dies eine bedeutende Stärke: Die Schüler müssen keine sehr spezielle "statistische" Sprache wie R-stat lernen. Gleichzeitig können sie auch Java lernen, was viele Möglichkeiten eröffnet, wenn sie sich entscheiden, in die Branche zu gehen.

J. Removel
quelle
-1

Es gibt eine neue Software namens Rguroo, eine Webanwendung. Die Verwendung ist sehr bequem, da keine Downloads oder Installationen erforderlich sind. Rguroo verfügt über eine R-Engine, für deren Verwendung ist jedoch keine R-Codierung erforderlich, da Sie die Leistung von R mithilfe der grafischen Point-and-Click-Oberfläche nutzen können. Jede Analyse ist speicherbar und reproduzierbar. Wir haben diese Software in den letzten drei Jahren für unsere Einführungs- und Zwischenkurse in Statistik verwendet. Zu diesem Zeitpunkt ist es kostenlos und Sie können ein Konto unter www.Rguroo.com erstellen. Basierend auf den Informationen, die ich habe, bleibt es für alle Fakultäten kostenlos und es wird eine angemessene jährliche Abonnementgebühr für Studenten zwischen 10 und 20 Dollar erhoben.

Mori J.
quelle