Übergang von der Verwendung statistischer Software zum Verständnis mathematischer Gleichungen?

12

Kontext:

Ich bin ein Psychologie-Doktorand. Wie bei vielen Doktoranden der Psychologie weiß ich, wie man mit statistischer Software verschiedene statistische Analysen durchführt, bis hin zu Techniken wie PCA, Klassifikationsbäumen und Clusteranalyse. Aber es ist nicht wirklich befriedigend, denn obwohl ich erklären kann, warum ich eine Analyse durchgeführt habe und was die Indikatoren bedeuten, kann ich nicht erklären, wie die Technik funktioniert.

Das eigentliche Problem ist, dass das Beherrschen von Statistiksoftware einfach, aber begrenzt ist. Um neue Techniken in Artikeln zu lernen, muss ich verstehen, wie man mathematische Gleichungen liest. Zur Zeit konnte ich keine Eigenwerte oder K-Mittelwerte berechnen. Gleichungen sind für mich wie eine Fremdsprache.

Frage:

  • Gibt es einen umfassenden Leitfaden, der zum Verständnis von Gleichungen in Zeitschriftenartikeln beiträgt?

Bearbeiten:

Ich dachte, die Frage wäre selbsterklärender: Ab einer gewissen Komplexität wird die statistische Notation für mich zu einem Kauderwelsch. Nehmen wir an, ich möchte meine eigenen Funktionen in R oder C ++ programmieren, um eine Technik zu verstehen, aber es gibt eine Barriere. Ich kann eine Gleichung nicht in ein Programm umwandeln. Und wirklich: Ich kenne die Situation an US-amerikanischen Doktorandenschulen nicht, aber in meinem (Frankreich) kann ich nur Kurse besuchen, in denen es um die Wurfbewegung des 16. Jahrhunderts geht ...

Coronier
quelle
@Coronier Entschuldigung, ich bezweifle, dass es einen umfassenden Leitfaden zum Verständnis von Psychologie-Artikeln gibt, die statistische Modelle verwenden. Der erforderliche Hintergrund sollte jedoch alle auf dem Niveau eines Master-Abschlusses in Statistik liegen. Wenn sich Ihr Programm dafür bezahlt macht, sollten Sie erwägen, einen Master in Statistik zu machen. Die nächstbeste Option für Ihre Zwecke könnte sein, die Version der multivariaten Statistiken der Statistikabteilung erneut zu verwenden - normalerweise enthalten diese Notizen den mathematischen Hintergrund für PCA, Clustering, Bäume usw. Sie benötigen einen Hintergrund in linearer Algebra und grundlegender Mathematik Statistiken unabhängig.
gesperrt
Bitte stellen Sie genauere Fragen.
4
Ich bin auch ein Psychologie-Doktorand und habe mich in meinen Studienjahren für eine bedeutende Menge an Mathematik entschieden, weil es so viele Psychologie-Doktoranden gab, die keine Ahnung hatten, wie ein PCA (zum Beispiel) berechnet wurde. Das allererste, was Sie tun müssen, ist sich durch ein anständiges Lehrbuch für lineare Algebra zu arbeiten. Was ist ein anständiges Lehrbuch für lineare Algebra? Gilbert Strangs ist die Bombe und er hat Videovorträge zu seinem Kurs über lineare Algebra auf der MIT-Website. Sie können sie sogar auf iTunes bekommen.
Phillip Cloud
1
Die Frage ist so weit gefasst, dass sie in einigen Absätzen nicht zufriedenstellend beantwortet wird. Statistiken sind wie Fragen: Es wird einfacher, wenn Sie sie in mehrere verwaltbare Komponenten aufteilen.
Fr.
Ich kann den obigen Kommentaren nur zustimmen. Entweder müssen Sie sich auf ein bestimmtes Thema konzentrieren, oder Sie müssen erst einige Lehrbücher oder Online-Handouts durcharbeiten. Ein anständiges Lehrbuch, das grundlegende Konzepte für multivariate Statistiken mit Illustrationen behandelt, ist Mathematical Tools for Applied Multivariate Analysis von Carroll und Green (AP, 1997, Rev. Ed.). Eine andere ist Applied Multivariate Statistics and Mathematical Modeling von Tinsley und Brown (AP, 2000).
chl

Antworten:

9

Überblick:

  • Mein Eindruck ist, dass Ihre Erfahrung vielen Studenten der Sozialwissenschaften gemeinsam ist.
  • Ausgangspunkt ist eine Lernmotivation.
  • Sie können entweder autodidaktische oder formelle Unterrichtswege einschlagen.

Formale Anweisung:

Diesbezüglich gibt es viele Optionen. Sie könnten einen Master in Statistik in Betracht ziehen oder nur ein paar Fächer in einer Statistikabteilung belegen. Wahrscheinlich möchten Sie jedoch überprüfen, ob Sie über die erforderlichen mathematischen Kenntnisse verfügen. Je nach Kurs müssen Sie möglicherweise die Mathematik vor dem Rechnen und möglicherweise einige Materialien wie den Kalkül und die lineare Algebra überdenken, bevor Sie sich mit mathematisch strengen Statistikfächern auf Universitätsniveau befassen.

Selbst beigebracht

Alternativ können Sie den autodidaktischen Weg gehen. Es gibt jede Menge guter Ressourcen im Internet. Insbesondere das Lesen und Ausführen von Übungen in Mathematiklehrbüchern ist wichtig, aber wahrscheinlich nicht ausreichend. Es ist wichtig, den Lehrern zuzuhören, die über Mathematik sprechen, und sie beim Lösen von Problemen zu beobachten.

Es ist auch wichtig, über Ihre mathematischen Ziele und die mathematischen Voraussetzungen nachzudenken, die zum Erreichen dieser Ziele erforderlich sind. Wenn Gleichungen für Sie wie eine Fremdsprache sind, müssen Sie möglicherweise zuerst die Grundlagen der Mathematik studieren.

Ich habe einige Ressourcen zusammengestellt, die Menschen beim Übergang von der Verwendung statistischer Software zum Verständnis der zugrunde liegenden Mathematik unterstützen sollen.

  • Videos : Liste der kostenlosen Online-Mathematikvideos - Dieser Beitrag enthält auch eine Anleitung zu einer geeigneten mathematischen Sequenz, die von der Vorberechnung über die Berechnung bis zur linearen Algebra, der Wahrscheinlichkeit und der mathematischen Statistik reicht. Sehen Sie sich diese Frage auch bei Videos zur mathematischen Statistik an .
  • Lesen und Aussprechen - Eine der ersten Herausforderungen ist das Erlernen der Aussprache und des Lesens mathematischer Gleichungen. Ich habe zwei Posts geschrieben, einen über Aussprache und einen über Tipps zum Lesen von Mathematik für Nicht-Mathematiker .
  • Schreiben - Das Schreibenlernen von Mathematik kann beim Lesen von Mathematik hilfreich sein. Versuchen Sie, LaTeX zu lernen, und lesen Sie einige Anleitungen zur Mathematik in LaTeX
  • Bücher : Wenn es um das Erlernen von Mathematik geht, lohnt es sich, in ein paar gute Lehrbücher zu investieren. Allerdings gibt es viele kostenlose Online - Optionen in diesen Tagen
Jeromy Anglim
quelle
Vielen Dank, die Ressourcen, die Sie zur Verfügung stellen, sind großartig. Übrigens, Ihr Blog ist total spannend (ich bin ein I / OP-Student und nutze R, es ist wie eine Offenbarung für mich).
Coronier
@Coronier Es ist großartig, eine andere Person zu treffen, die R mit I / O Psych kombiniert.
Jeromy Anglim
3

Ich habe den Eindruck, dass Sie glauben, Sie könnten einen Einblick in eine statistische Gleichung erhalten, indem Sie sie in R oder C ++ programmieren. du kannst nicht. Um eine statistische Gleichung zu verstehen, finden Sie am Ende jedes Kapitels, das die Gleichung enthält, ein Lehrbuch für Studenten mit vielen Hausaufgabenproblemen, und erledigen Sie die Hausaufgaben am Ende des Kapitels, das die Gleichung enthält.

Zum Verständnis von PCA benötigen Sie beispielsweise ein gutes Verständnis der linearen Algebra und insbesondere der Singulärwertzerlegung. Während ich mit Michael Nielsens Buch Quantencomputer lernte, wurde mir klar, dass ich die lineare Algebra überprüfen musste. Gilbert Strangs Videos haben mir sehr geholfen, ein grundlegendes Verständnis für Konzepte zu entwickeln. Die Nuance des Materials setzte sich jedoch erst durch, als ich ein Buch mit linearer Algebra fand, das viele Hausaufgabenprobleme enthielt, und dann musste ich sie erledigen.

schenectady
quelle
4
@ schenectady während ich mit deinem Standpunkt sympathisiere, bietet mir der R-Code zumindest eine Brücke, die ich verwenden kann, um mein Verständnis der betreffenden Gleichungen und Mathe zu verbessern. Trotzdem stimme ich der Notwendigkeit von Problemen, Statistiken und Mathematik im Allgemeinen voll und ganz zu.
Richiemorrisroe
2

Ich verstehe Ihre Schwierigkeit, da ich ein ähnliches Problem habe, wenn ich versuche, etwas Neues in der Statistik zu machen (ich bin auch ein Doktorand, aber auf einem anderen Gebiet). Ich habe festgestellt, dass es sehr nützlich ist, den R-Code zu untersuchen, um eine Vorstellung davon zu bekommen, wie etwas berechnet wird. Zum Beispiel habe ich kürzlich gelernt, wie man es benutztkmeans Clustering einsetzt, und habe viele grundlegende Fragen, sowohl konzeptionell als auch wie es implementiert wird. Unter Verwendung einer RInstallation (ich empfehle R Studio, http://www.rstudio.org/ , aber jede Installation funktioniert), geben Sie einfach kmeansin die Befehlszeile. Hier ist ein Beispiel eines Teils der Ausgabe:

x <- as.matrix(x)
    m <- nrow(x)
    if (missing(centers)) 
        stop("'centers' must be a number or a matrix")
    nmeth <- switch(match.arg(algorithm), `Hartigan-Wong` = 1, 
        Lloyd = 2, Forgy = 2, MacQueen = 3)
    if (length(centers) == 1L) {
        if (centers == 1) 
            nmeth <- 3
        k <- centers
        if (nstart == 1) 
            centers <- x[sample.int(m, k), , drop = FALSE]
        if (nstart >= 2 || any(duplicated(centers))) {
            cn <- unique(x)
            mm <- nrow(cn)
            if (mm < k) 
                stop("more cluster centers than distinct data points.")
            centers <- cn[sample.int(mm, k), , drop = FALSE]
        }
    } 

Ich bin mir nicht sicher, wie praktisch es ist, die Quelle jedes Mal zu untersuchen, aber es hilft mir wirklich, eine Vorstellung davon zu bekommen, was los ist, vorausgesetzt, Sie kennen sich mit der Syntax aus.

Eine frühere Frage, die ich zu stackoverflow gestellt habe, hat mich in diese Richtung gelenkt, hat mir aber auch hilfreich gesagt, dass die Kommentare zum Code manchmal hier enthalten sind .


Im Allgemeinen ist die veranschaulicht Journal of Statistical Software diesen Zusammenhang zwischen Theorie und Implementierung, handelt jedoch häufig von fortgeschrittenen Themen (die ich persönlich nur schwer verstehe), ist aber als Beispiel nützlich.

Celenius
quelle