Welche häufigen Statistikthemen sollte ich kennen, bevor ich Bayes'sche Statistik lerne?

8

Ich habe mich gefragt, ob es eine Untergruppe von Themen der frequentistischen Statistik gibt, die man kennen sollte, bevor man anfängt, Bayes'sche Statistik zu lernen. Sobald ich gelesen habe, dass es scheint, dass die beiden Trends einander entgegenwirken; Wie zum Beispiel basiert die frequentistische Analyse stark auf Annahmen (Hypothesen), die über beobachteten Daten gemacht werden. Während die Bayes'schen Statistiken eher auf der Konstruktion eines früheren Modells beruhen, um auf spätere Informationen darüber zu schließen.

Welche Themen der frequentistischen oder allgemeinen Statistik sollte ich auf jeden Fall kennen, bevor ich mit der Bayes'schen Statistik beginne?

Layla
quelle
"Antagonist untereinander" -> "Antagonist untereinander"?
Faheem Mitha

Antworten:

6

Es ist nicht notwendig, es als frequentistisches Material zu bezeichnen, sondern als Material aus Wahrscheinlichkeit und Statistik im Allgemeinen.

Hier einige Beispiele für Vorkenntnisse, die meiner Meinung nach nützlich wären:

  1. Was sind Dichten, (bedingte) Verteilungen, Erwartungen usw.?
  2. Einige spezifische Verteilungsfamilien (Beta, normal, einheitlich usw.)
  3. Höchstwahrscheinlich möchten Sie Bayes'sche Methoden auf reale Daten anwenden, also statistische Software. Mein Favorit: R.
  4. Einige Mathematik: Matrixalgebra, Integration, ...
  5. y=Xβ+u
  6. Angesichts der starken Betonung der Wahrscheinlichkeit kann es nicht schaden, zuvor von der maximalen Wahrscheinlichkeit gehört zu haben

Da das Bayes'sche Paradigma subjektiv ist, bin ich sicher, dass andere dieser Liste nicht zustimmen oder sie ergänzen werden ...

Christoph Hanck
quelle
Ihre Antwort auf die Frage "Welche frequentistischen Themen soll ich lernen?" Lautet also im Grunde "keine". Weil Sie häufig auftretende Themen wie Nullhypothesen, p-Werte oder unvoreingenommene Schätzer explizit ausgelassen haben
Nikie
1
Nun, ich muss sagen, ich habe noch nie jemanden getroffen (oder zumindest darüber gesprochen), der Bayes'sche Statistik vor frequentistischer Statistik gelernt hat, aber das wäre meine Meinung, ja, da diese Themen aus Bayes'scher Sicht relativ weniger wichtig sind . Natürlich gibt es Ergebnisse zu Bayes'schen Hypothesentests und zu häufig auftretenden Eigenschaften von Bayes-Schätzern (z. B. Unparteilichkeit). Aber ich würde argumentieren, dass dies nicht notwendig ist, um mit dem Lernen zu beginnen , wie Sie gefragt haben.
Christoph Hanck
10

Sie müssen keine "frequentistischen" oder Bayes'schen Statistiken in einer bestimmten Reihenfolge lernen. Sie sollten zuerst lernen, was Sie brauchen, um die Ergebnisse auf Ihrem Gebiet zu verstehen, und dann sollten Sie die mathematischen (Berechnung) und philosophischen (Interpretation) Beziehungen zwischen den Techniken verstehen. Es gibt keinen Lehrer wie echte Daten, daher ist dies immer das erste Anliegen.

Es gibt keinen besonderen Grund, warum Sie sie nicht gleichzeitig lernen könnten. Es ist hilfreich, den Kern des Kalküls für Bayes zu kennen, von dem vermutlich der Ruf stammt, "härter" zu sein, aber ich würde es jetzt nicht als notwendig bezeichnen, da wir eine viel bessere Software haben als noch vor wenigen Jahren. Wenn Sie neu in der Statistik sind und sowohl mit dem frequentistischen als auch mit dem Bayes'schen Framework herumspielen möchten , kann ich die neue JASP- Software empfehlen . Wenn Sie R mögen, ist das BayesFactor-Paket solide.

Wenn Sie von Frequentismus ausgehen möchten, würde ich vorschlagen, Folgendes zu wissen:

  1. Die vollständige und genaue Interpretation für alle folgenden Punkte.
  2. Die Beziehung zwischen p-Werten, Konfidenzintervallen, Stichprobengrößen, Leistung und Fehlerraten.
  3. Die Beziehung zwischen Z-Tests, T-Tests, Varianzanalyse und linearer Regression.
  4. Die Beziehung zwischen linearer Regression und nichtlinearer Regression sowie parametrischen und nichtparametrischen Tests.
  5. Die Beziehung zwischen Dummy-Variablen, Kontrasten und Effektcodierung.
  6. Die vollständige und genaue Interpretation für alle vorhergehenden Punkte.

Das klingt nach viel, aber diese Dinge hängen alle grundlegend zusammen. Jede Schlussfolgerung läuft auf dasselbe Wesentliche hinaus: Wir möchten korrekte Vorhersagen über nicht beobachtete Daten treffen, basierend auf einem Modell beobachteter Daten, indem wir zwei oder mehr Modelle vergleichen. Wir tun dies, indem wir unser Vertrauen für eine Definition von "Vertrauen" in zwei oder mehr Modellen berechnen und das Verhältnis nehmen. Im einfachsten Fall ist das alles.

Bei vielen Kontroversen geht es eigentlich nur darum, "Vertrauen" zu formalisieren, und obwohl es eine wichtige Diskussion ist, über die ich froh bin, dass wir sie haben, müssen Sie sich darüber im Moment nicht bewusst sein. Im frequentistischen Rahmen werden spezielle Schritte unternommen, um ein implizites Nullmodell für den Nenner zu erstellen, während im Bayes'schen Rahmen beide Modelle explizit angegeben werden, die tatsächliche Ausgabe und Interpretation für beide Rahmen jedoch einen erheblichen Grad an Subjektivität beinhaltet. Für den Frequentismus liegt es in der Konstruktion der maximalen Wahrscheinlichkeit und der Wahl der Fehlerrate, und für die Bayesianer liegt es im Prior. Meiner Ansicht nach sollte jeder beides lernen.

Christian Hummeluhr
quelle