Was waren die wichtigsten statistischen Beiträge von Ronald Fisher?

13

Richard Dawkins hat Ronald Fisher als "den Vater der modernen Statistik und des experimentellen Designs" beschrieben, eine Linie, die in Fischers Wikipedia-Biographie zitiert wird . Und auch Anders Hald nannte ihn in seinem Buch A History of Mathematical Statistics "ein Genie, das fast im Alleingang die Grundlagen für die moderne Statistikwissenschaft geschaffen hat" .

Ich frage mich nur, was genau er getan hat, damit die Leute ihn so hoch einschätzen?

WCMC
quelle
10
Dies wäre ein großartiger Beitrag für HSM .
Antoni Parellada
6
@Antoni Ich denke, irgendwann in der Zukunft, wenn HSM weiter wächst und gedeiht, könnte HSM ein besseres Zuhause für Fragen der statistischen Geschichte werden. Aber es gibt eine so starke Expertise in Bezug auf Lebensläufe, dass viele Benutzer, die ein echtes Interesse an historischen Aspekten haben, der Meinung sind, dass Lebensläufe derzeit der bessere Ort sind. (Ich denke, auf lange Sicht wird der Lebenslauf wahrscheinlich weiterhin der bessere Ort für die eher "konzeptuellen" historischen Fragen sein.)
Silverfish,
3
Ich denke nicht, dass der potenzielle "meinungsbasierte" Charakter dieser Frage das Problem ist. Ich bin mit @AntoniParellada einverstanden: Wenn diese Frage nicht auf der SE-Site Geschichte der Naturwissenschaften und Mathematik steht , ist nicht klar, was sie bedeuten würde. Wir sind es unseren SE-Kollegen schuldig, es dorthin zu migrieren. Der ursprüngliche Rahmen war vollkommen in Ordnung.
gung - Wiedereinsetzung von Monica
3
Ich stimme zu, 'nette Frage', aber vielleicht nicht hier. Die Arbeiten von Fisher sind bereits in einem hübschen Band " Contributions to Mathematical Statistics" zusammengefasst , der in jedem Antiquariat erhältlich ist. Eine Rezension finden Sie unter: jstor.org/stable/2332332 Ich kann persönlich keine besseren Wörter hinzufügen und kann mich nur auf Efron beziehen. Jstor.org/stable/2676745 Was in der Tat interessant wäre und Informationen hinzufügt, ist eine Ansicht von Historikern. (oder Philosophen, da die verschiedenen Statistikansichten eine obwohl Frage ist und ich es eigentlich nicht wirklich verstehe, dh ich benutze alle von ihnen)
Sextus Empiricus
7
@MatthewDrury Wir haben ein relativ beliebtes [history] -Tag. Fragen zur Geschichte sind auf unserer Website zum Thema. Wenn hier etwas zum Thema gehört, sollten wir es IMHO nicht wegmigrieren, auch wenn es auch woanders zum Thema gehört.
Amöbe sagt Reinstate Monica

Antworten:

19

Es ist sehr schwierig, eine Antwort auf die Frage zu schreiben

Was waren die wichtigsten statistischen Beiträge von Ronald Fisher?

da es bereits zahlreiche hervorragende Werke zu diesem Thema gibt, die von hervorragenden Schriftstellern, einschließlich hervorragender Statistiker, verfasst wurden, zB:

Es ist sehr schwierig, diese Arbeiten in ein paar einfachen Zeilen auf einer Internet-Q & A-Tafel zu vergleichen. Darüber hinaus ist es nicht ganz einfach, die Gesamtheit der Ideen von Fisher zu erfassen, wie Efron in seiner Arbeit über Fisher schrieb:

Eine Schwierigkeit bei der Beurteilung der Bedeutung der Fischerstatistik besteht darin, dass es schwierig ist, nur zu sagen, was es ist. Fisher hatte eine erstaunliche Anzahl wichtiger Ideen, und einige davon, wie Randomisierungsinferenz und Konditionalität, sind widersprüchlich. Es ist ein bisschen so, als ob sich in der Wirtschaft Marx, Adam Smith und Keynes als dieselbe Person herausgestellt hätten.


Fisher war ein Pionier

Bereits eine einfache, aber sehr gute Quelle für Fischers Beitrag ist Wikipedia. Wenn Sie nur den Artikel über die Geschichte der Statistik lesen (oder einen anderen Text verwenden), erhalten Sie einen Einblick in die Höhe und Bedeutung der Beiträge von Fisher.

Sie werden auch sehen, dass es zum Teil Zeit, Ort und Glück sind, die Fisher zu einem großartigen Mitwirkenden gemacht haben. Fisher war ein wichtiger und einflussreicher Statistiker im frühen 20. Jahrhundert, als die Grundlagen der angewandten Statistik geschaffen wurden und das Feld relativ klein war (vergleichbar mit der Periode des 18. und 19. Jahrhunderts in der Mathematik).

Das erste Statistikjournal und die erste Statistikabteilung einer Universität waren gerade gestartet, als Fisher die Bühne betrat. Vor dem Beginn des 20. Jahrhunderts gab es hauptsächlich Methoden zur Regression und verschiedene Vorstellungen zur Verteilung von Restbegriffen und Fehlern, die in Bereichen wie der Astronomie verwendet wurden.

Konzepte von Messfehlern und Ergebniswahrscheinlichkeiten. Diese Art von Mathematik und Logik (die eher der reinen Mathematik ähnelt und von den ernsthaften Mathematikern dieser Zeit als edler und weniger verurteilt angesehen wird) wurde in den von Fisher gewählten Bereichen weiter verbreitet: Genetik, Evolution, Biologie, Landwirtschaft . Da der ausgezeichnete Mathematiker Fisher einen wesentlichen Beitrag zu diesen frühen Entwicklungen geleistet hat (oder sogar als Hauptantrieb für diese Entwicklungen gelten kann), hat seine Arbeit eine wichtige Position in der Geschichte der Statistik eingenommen.

Grundlegende Konzepte und Tools

Wenn Sie sich die Themen in einem Einführungsbuch zur Statistik ansehen (insbesondere die mathematischen Konzepte oder Schlussfolgerungen), können Sie Fisher als den dominierenden Beitrag betrachten. Es ist auch Fisher, der die erste und einflussreichste Einführung in Statistikbücher geschrieben hat :

  • Statistische Methoden für Forscher (1925)
  • Die Versuchsplanung (1935) (erklärt anhand des Teetassexperiments unter anderem die Randomisierung, die Verwendung lateinischer Quadrate, die Nullhypothese, die Signifikanz, die Sensitivität / Potenz und im Grunde alles; Yates liefert einen historischen Hintergrund für diese Arbeit)

Beachten Sie, dass Online-Versionen dieser Bücher SMRW und teilweise DE existieren (siehe Lesungen 29. Oktober b) .

Von 1912 bis 1925, Fisher:

  • half, den Chi-Quadrat-Test zu verbessern (wo Pearson und andere über die Anzahl der Freiheitsgrade für viele Jahre falsch lagen),
  • einen exakten Test zur Berechnung des p-Werts für die Anpassungsgüte mit einer geringen Anzahl von Beobachtungen (der nach ihm als exakter Test des Fischers benannt wurde ) lieferte ,
  • N1N
  • entwickelte Varianz- und F-Verteilungsanalyse (auch nach ihm benannt) und
  • (Ein weiteres "kleines" Ding, das er als Student gemacht hat), war die Entwicklung der Grundlagen und Konzepte für maximale Wahrscheinlichkeit ( Aldrichs RA Fisher und das Bilden maximaler Wahrscheinlichkeit ).

In etwa deckt dies die meisten grundlegenden Inferenzwerkzeuge ab, die in aktuellen Einführungstexten verwendet werden. Während dieser Arbeit an Statistiken ging Fisher auf große genetische Probleme ein, die Leute wie Richard Dawkins dazu bringen, ihn so sehr zu bewundern.

Terminologie

L2L1L2L1'Varianz' (in seiner Arbeit von 1920 Eine mathematische Beobachtung der Methoden zur Bestimmung der Genauigkeit der Beobachtung durch den mittleren Fehler und den mittleren quadratischen Fehler ).

Stiftungen

In dem Papier von 1922 über die mathematischen Grundlagen der theoretischen Statistik gibt Fisher einen kurzen und einfachen Überblick über die wichtigsten Konzepte, um nur die Liste der Definitionen zu nennen: "Standortzentrum", "Konsistenz", "Verteilung", "Effizienz", " Schätzung ',' intrinsische Genauigkeit ',' isostatistische Regionen ',' Wahrscheinlichkeit ',' Ort ',' Optimum ',' Skalierung ',' Spezifikation ',' Suffizienz ',' Gültigkeit ' . Es bedarf eines Historikers, um zu sehen, was Fisher hier im Sinne des Urhebers von Konzepten beigetragen hat, und dies bezieht sich auch auf Efrons Aussage. Es ist schwer zu verstehen, was genau von wem beigetragen wird.

In diesem Artikel erwähnt Fisher das Problem der Anwendung von Begriffen wie "Mittelwert" und "Varianz" sowohl auf den wahren Verteilungswert als auch auf den geschätzten Wert.

(Ich werde versuchen zu vermeiden, Fisher irgendwo in eine "Schule" wie einen Frequentisten oder einen Bayesianer zu stecken. Ich würde sagen, er war für jede Frage "ausreichend" praktisch.)

Fortgeschrittene Konzepte

In seiner weiteren Arbeit entwickelte Fisher frühe Konzepte der linearen Diskriminanzanalyse :

X=λ1x1+λ2x2+λ3x3+λ4x4

Die Verwendung von Mehrfachmessungen in taxonomischen Problemen, 1936

und das Konzept der Abschätzung nach Wahrscheinlichkeit, das Fisher weiter erforschte, und zwei nach ihm benannte Konzepte aufweist, Fisher-Information und Fisher-Score . Siehe Theorie der statistischen Schätzung, 1925 , Zwei neue Eigenschaften der mathematischen Wahrscheinlichkeit, 1934 und Die Logik der induktiven Folgerung, 1935 .

Weitere Links:

  • RA Fisher Guide , von John Aldrich. Eine enorme Quelle, wenn nicht die größte, mit Informationen zu Fisher und vielen weiteren Referenzen.
  • Michael Hardys Antwort auf Mathoverflow auf eine Frage zu den größten Mathematikern: /mathpro//a/173374

Geschrieben von StackExchangeStrike

Sextus Empiricus
quelle
Vielen Dank @Martijn! Ich ging Ihre Antwort durch und nahm hier und da kleine Änderungen vor, hauptsächlich, um die Formatierung klarer zu machen und einige Tippfehler zu beheben. Ich hoffe es macht dir nichts aus. Ich freue mich, diese Antwort mit meinem Kopfgeld zu belohnen. sehr guter beitrag. Es ist besonders schön, all diese Referenzen zu haben.
Amöbe sagt Reinstate Monica
Überhaupt nicht, tolle Änderungen, deshalb habe ich es zu einem Community-Wiki gemacht. Dies ist eine große Frage, die zu beantworten ist. Obwohl ich ein großer Fan von Fisher bin und einige seiner Artikel durchgesehen habe, hatte ich das Gefühl, dass ich diese (geladene) Frage nicht hätte beantworten sollen.
Sextus Empiricus
Ich habe deine Antwort in unserem Chat beworben und jetzt sehe ich, dass sie die am meisten bewertete Antwort in diesem Thread wurde. Ich denke, es ist gut verdient.
Amöbe sagt Reinstate Monica
8

Einige Konzepte hat er erfunden: Suffizienz, Effizienz, ANOVA, Anzillarität, p-Wert und wahrscheinlich eine Vielzahl anderer (vor allem Versuchsplanung).

Die Wahrscheinlichkeitsfunktion und die mle's hatten Vorläufer, wurden aber von ihm popularisiert.

kjetil b halvorsen
quelle
9
+1 Obwohl Fisher diesbezüglich sicherlich Anerkennung erhalten sollte, scheint das Konzept des p-Werts zumindest informell vor der Arbeit von FIsher bestanden zu haben. Pearson berechnet in seinem Artikel aus dem Jahr 1900 eindeutig p-Werte für den Chi-Quadrat-Fit-Test und behandelt das, was er berechnet (wenn es nur im Vorbeigehen beschrieben wird), als ob es eine offensichtliche, akzeptierte Aufgabe wäre. Man hat den Eindruck, dass es sich nicht um ein neues Konzept handelt, das in diesem Artikel vorgestellt wurde. Natürlich könnte man von vielen Konzepten ähnliche Dinge sagen ... sie sind oft eine Weile "da", bevor jemand sie formalisiert.
Glen_b -Reinstate Monica
8

Sir Ronald Aylmer Fisher werden zahlreiche Aspekte des experimentellen Designs und der modernen statistischen Theorie und Praxis zugeschrieben. Zu seinen wichtigsten Beiträgen zählen Signifikanztests (Bandyopadhyay und Cherry 2011), Maximum Likelihood Estimation (MLE), Permutationsverteilungen (Re-Sampling), Suffizienz, asymptotische Optimalitätstheorie (Efron 1998) und experimentelle Designkomponenten, einschließlich Randomisierung, Replikation. Blockieren, Verwechseln und Varianzanalyse (ANOVA). Bemerkenswert ist auch seine Behauptung über Mendels Experiment mit Erbsenpflanzen. Er behauptete, es sei "zu gut, um wahr zu sein".

Lesen Sie die Zeitung von Efron (1998) "RA Fisher im 21. Jahrhundert". Lassen Sie mich das Abstract zitieren:

Fischer ist die wichtigste Einzelfigur in der Statistik des 20. Jahrhunderts. Dieser Vortrag untersucht seinen Einfluss auf das moderne statistische Denken und versucht vorherzusagen, wie fischerisch wir das 21. Jahrhundert erwarten können. Fischers Philosophie zeichnet sich durch eine Reihe geschickter Kompromisse zwischen der bayesianischen und der frequentistischen Sichtweise aus, die durch einige einzigartige Merkmale ergänzt werden, die insbesondere bei angewandten Problemen nützlich sind. Verschiedene aktuelle Forschungsthemen werden mit Blick auf den Einfluss der Fischer oder das Fehlen von Einfluss untersucht und was dies für zukünftige statistische Entwicklungen bedeutet. Basierend auf der Fisher-Vorlesung von 1996 folgt der Artikel genau dem Text dieses Vortrags.

Verweise

  • Bandyopadhyay, Prasanta S. und Steve Cherry. "Elementare Wahrscheinlichkeit und Statistik: Ein Primer." Philosophie der Statistik 7 (2011): 53.

  • Efron, Bradley. " RA Fisher im 21. Jahrhundert ." Statistical Science (1998): 95 & ndash; 114.

Jessica Burnett
quelle
1
Seine Version des Signifikanztests war eine umstrittene Vergleichsinferenz, die nicht so akzeptiert wurde wie die Neyman-Pearson-Theorie. Andere Beiträge waren monumental und Teil der Grundlagen der Statistik.
Michael R. Chernick
3
Nun, Treuhandschluss scheint jetzt einige Fans zu finden. Ich stelle fest, dass noch niemand Fisher-Informationen oder nützliche Richtlinien wie "Sie analysieren als Zufallsgenerator" erwähnt hat.
Björn
Björn - ja, ich habe definitiv den Fisher-Informationsteil verpasst. Wahrscheinlich, weil ich diesen Text von einem Papier kopiert habe, schreibe ich re: fisher information. Ha!
Jessica Burnett