Haftungsausschluss: Ich bin kein Statistiker, sondern ein Software-Ingenieur. Der größte Teil meiner statistischen Kenntnisse stammt aus der Selbsterziehung, daher habe ich immer noch viele Lücken im Verständnis von Konzepten, die für andere hier trivial erscheinen könnten. Daher wäre ich sehr dankbar, wenn die Antworten weniger spezifische Begriffe und mehr Erklärungen enthalten würden. Stell dir vor, du sprichst mit deiner Oma :)
Ich versuche, die Art der Betaverteilung zu verstehen - wofür sie verwendet werden sollte und wie sie in jedem Fall zu interpretieren ist. Wenn wir zum Beispiel von Normalverteilung sprechen, könnte man es als Ankunftszeit eines Zuges bezeichnen: Am häufigsten kommt es gerade rechtzeitig an, etwas seltener ist es 1 Minute früher oder 1 Minute zu spät und sehr selten kommt es mit Unterschied an von 20 Minuten vom Mittelwert. Die einheitliche Verteilung beschreibt insbesondere die Chance jedes Lottospielscheins. Die Binomialverteilung kann mit Münzwurf usw. beschrieben werden. Aber gibt es eine solche intuitive Erklärung für die Betaverteilung ?
Nehmen wir an, und . Die sieht in diesem Fall so aus (generiert in R):
Aber was heißt das eigentlich? Die Y-Achse ist offensichtlich eine Wahrscheinlichkeitsdichte, aber was ist auf der X-Achse?
Ich würde mich sehr über jede Erklärung freuen, sei es mit diesem oder einem anderen Beispiel.
Antworten:
Die kurze Version ist, dass die Beta-Verteilung als Verteilung von Wahrscheinlichkeiten verstanden werden kann - das heißt, sie repräsentiert alle möglichen Werte einer Wahrscheinlichkeit, wenn wir nicht wissen, was diese Wahrscheinlichkeit ist. Hier ist meine bevorzugte intuitive Erklärung dafür:
Jeder, der dem Baseball folgt, kennt sich mit Schlagmitteln aus - einfach mit der Häufigkeit, mit der ein Spieler einen Basisschlag erzielt, dividiert durch die Häufigkeit, mit der er beim Schläger hochgeht (also nur ein Prozentsatz zwischen
0
und1
)..266
wird im Allgemeinen als ein durchschnittlicher Schlagdurchschnitt angesehen, während er.300
als ein ausgezeichneter angesehen wird.Stellen Sie sich vor, wir haben einen Baseballspieler, und wir möchten vorhersagen, wie hoch sein saisonaler Schlagdurchschnitt sein wird. Man könnte sagen, wir können nur seinen Schlagdurchschnitt verwenden, aber dies wird zu Beginn einer Saison ein sehr schlechtes Maß sein! Wenn ein Spieler einmal Schläger nach oben geht und bekommt eine einzelne, ist seine Batting Durchschnitt kurz
1.000
, während , wenn er streicht, seine Batting Durchschnitt ist0.000
. Es wird nicht viel besser, wenn Sie fünf oder sechs Mal aufschlagen - Sie könnten eine Glückssträhne bekommen und einen Durchschnitt von1.000
, oder eine Pechsträhne bekommen und einen Durchschnitt von0
, von denen keine ein annähernd guter Prädiktor dafür ist, wie Sie werden in dieser Saison schlagen.Warum ist Ihr Schlagdurchschnitt in den ersten Treffern kein guter Prädiktor für Ihren späteren Schlagdurchschnitt? Wenn der erste Schlag eines Spielers ein Streik ist, warum sagt niemand voraus, dass er die ganze Saison über nie getroffen wird? Weil wir mit früheren Erwartungen weitermachen . Wir wissen, dass in der Geschichte die meisten Wimper-Durchschnittswerte in einer Saison zwischen ungefähr
.215
und lagen.360
, mit einigen äußerst seltenen Ausnahmen auf beiden Seiten. Wir wissen, dass ein Spieler, der zu Beginn ein paar Strikeouts hintereinander hat, möglicherweise schlechter als der Durchschnitt abschneidet, aber wir wissen, dass er wahrscheinlich nicht von diesem Bereich abweichen wird.In Anbetracht unseres durchschnittlichen Schlagproblems, das durch eine Binomialverteilung (eine Reihe von Erfolgen und Misserfolgen) dargestellt werden kann, ist die Beta-Verteilung der beste Weg, um diese früheren Erwartungen (die wir in der Statistik nur als Prior bezeichnen ) darzustellen. bevor wir gesehen haben, wie der Spieler seinen ersten Schlag ausführt, wie wir ungefähr erwarten, dass sein Schlagdurchschnitt ist. Die Domäne der Beta-Distribution ist
(0, 1)
genau wie eine Wahrscheinlichkeit, sodass wir bereits wissen, dass wir auf dem richtigen Weg sind - aber die Eignung der Beta für diese Aufgabe geht weit darüber hinaus.Wir gehen davon aus, dass der durchschnittliche Trefferwert des Spielers für die gesamte Spielzeit am wahrscheinlichstenα=81 β=219
.27
ist, dass er jedoch in einem angemessenen Bereich von.21
bis liegen könnte.35
. Dies kann mit einer Beta-Distribution mit den Parametern und :Ich habe mir diese Parameter aus zwei Gründen ausgedacht:
(.2, .35)
des für einen Schlagdurchschnitt angemessenen Bereichs.Sie haben gefragt, was die x-Achse in einem Beta-Verteilungsdichtediagramm darstellt - hier stellt sie seinen Schlagdurchschnitt dar. Beachten Sie also, dass in diesem Fall nicht nur die y-Achse eine Wahrscheinlichkeit (oder genauer gesagt eine Wahrscheinlichkeitsdichte) ist, sondern auch die x-Achse (der Schlagdurchschnitt ist schließlich nur eine Wahrscheinlichkeit eines Treffers)! Die Beta-Verteilung repräsentiert eine Wahrscheinlichkeitsverteilung von Wahrscheinlichkeiten .
Aber aus diesem Grund ist die Betaverteilung so angemessen. Stellen Sie sich vor, der Spieler bekommt einen einzigen Treffer. Sein Rekord für die Saison ist jetzt
1 hit; 1 at bat
. Wir müssen dann unsere Wahrscheinlichkeiten aktualisieren - wir möchten die gesamte Kurve ein wenig verschieben, um unsere neuen Informationen wiederzugeben. Obwohl die Mathematik, um dies zu beweisen, ein wenig kompliziert ist ( wie hier gezeigt ), ist das Ergebnis sehr einfach . Die neue Beta-Distribution wird sein:Wobei und die Parameter sind, mit denen wir begonnen haben - also 81 und 219. In diesem Fall hat sich also um 1 erhöht (sein einziger Treffer), während sich überhaupt nicht erhöht hat (noch keine Fehler) ). Das heißt, unsere neue Distribution ist oder:α0 β0 α β Beta(81+1,219)
Beachten Sie, dass es sich kaum verändert hat - die Veränderung ist für das bloße Auge in der Tat unsichtbar! (Das liegt daran, dass ein Treffer eigentlich nichts bedeutet).
Je mehr der Spieler im Laufe der Saison trifft, desto mehr verschiebt sich die Kurve, um den neuen Beweisen Rechnung zu tragen, und desto enger wird sie, je mehr Beweise wir haben. Sagen wir, in der Mitte der Saison hat er 300 Mal geschlagen und dabei 100 Mal geschlagen. Die neue Distribution wäre oder:Beta(81+100,219+200)
Beachten Sie, dass die Kurve jetzt sowohl dünner als auch nach rechts verschoben ist (höherer Schlagdurchschnitt), als es früher der Fall war, da wir den Schlagdurchschnitt des Spielers besser einschätzen können.
Eine der interessantesten Ausgaben dieser Formel ist der erwartete Wert der resultierenden Beta-Verteilung, die im Grunde Ihre neue Schätzung ist. Denken Sie daran, dass der erwartete Wert der Beta-Distribution . Nach 100 Treffern von 300 echten Fledermäusen ist der erwartete Wert der neuen Beta-Distribution also Beachten Sie, dass er niedriger als die naive Schätzung ist von , aber höher als die Schätzung, mit der Sie die Saison begonnen haben (αα+β 81+10081+100+219+200=.303 100100+200=.333 8181+219=.270 ). Sie werden vielleicht bemerken, dass diese Formel der Addition eines "Vorsprungs" zur Anzahl der Treffer und Nicht-Treffer eines Spielers entspricht. Sie sagen, Sie starten ihn in der Saison mit 81 Treffern und 219 Nicht-Treffern in seinem Rekord. ).
Somit ist die Beta - Verteilung am besten für eine probabilistische Verteilung darstellt , von Wahrscheinlichkeiten - den Fall, dass wir nicht wissen , was eine Wahrscheinlichkeit im Voraus, aber wir haben einige vernünftigen Vermutungen.
quelle
Mit einer Beta-Distribution werden Dinge modelliert, die einen begrenzten Bereich haben, z. B. 0 bis 1.
Beispiele sind die Erfolgswahrscheinlichkeit eines Experiments mit nur zwei Ergebnissen, wie Erfolg und Misserfolg. Wenn Sie eine begrenzte Anzahl von Experimenten durchführen und einige erfolgreich sind, können Sie das, was Ihnen das sagt, durch eine Betaverteilung darstellen.
Ein weiteres Beispiel ist die Auftragsstatistik . Wenn Sie beispielsweise mehrere (z. B. 4) einheitliche 0,1-Zufallszahlen generieren und sortieren, wie ist die Verteilung der dritten?
Ich benutze sie, um die Software-Leistungsdiagnose anhand von Stichproben zu verstehen. Wenn Sie ein Programm zufällig Mal anhalten und Mal sehen, dass es etwas tut, das Sie tatsächlich loswerden könnten, und , wird der Zeitanteil, der dadurch eingespart werden muss, durch und der Beschleunigungsfaktor hat eine BetaPrime- Verteilung.n s s>1 Beta(s+1,(n−s)+1)
Mehr dazu ...
quelle
Die Beta-Verteilung erscheint auch als Ordnungsstatistik für eine Zufallsstichprobe von unabhängigen Gleichverteilungen auf .(0,1)
Genauer gesagt, lassen , , seine unabhängige Zufallsvariablen, die jeweils die gleichmäßige Verteilung auf . Bezeichnen Sie mit , , die Ordnungsstatistik der Zufallsstichprobe , die durch Sortieren der Werte von , , in aufsteigender Reihenfolge definiert wird. Insbesondere und . Dann kann man zeigen, dass für jedes .U1 … Un n (0,1) U(1) … U(n) (U1,…,Un) U1 … Un U(1)=min(Ui) U(n)=max(Ui) U(k)∼Beta(k,n+1−k) k=1,…,n
Dieses Ergebnis zeigt, dass die Beta-Verteilungen natürlich in der Mathematik vorkommen und einige interessante Anwendungen in der Mathematik haben.
quelle
Es gibt zwei Hauptmotive:
Erstens ist die Beta-Verteilung vor der Bernoulli-Verteilung konjugiert. Das heißt, wenn Sie eine unbekannte Wahrscheinlichkeit wie die Vorspannung einer Münze haben, die Sie durch wiederholte Münzwürfe schätzen, ist die Wahrscheinlichkeit, die durch eine Folge von Münzwürfen auf die unbekannte Vorspannung ausgeübt wird, Beta-verteilt.
Zweitens ist die Beta-Verteilung als exponentielle Familie die maximale Entropieverteilung für eine Reihe ausreichender Statistiken. In der Beta-Distribution lauten diese Statistiken und für in . Das heißt, wenn Sie nur den Durchschnitt dieser ausreichenden Statistiken für eine Gruppe von Stichproben , können Sie als Mindestannahme für die Verteilung der Stichproben annehmen, dass sie Beta-verteilt sind.log(x) log(1−x) x [0,1] x1,…,xn
Die Betaverteilung ist nicht speziell für die allgemeine Modellierung von Dingen über [0,1], da viele Verteilungen auf diese Unterstützung gekürzt werden können und in vielen Fällen besser anwendbar sind.
quelle
Nehmen wir an, ein Verkäufer auf einer E-Commerce-Website erhält 500 Bewertungen, von denen 400 gut und 100 schlecht sind.
Wir sehen dies als Ergebnis eines Bernoulli-Experiments der Länge 500, das zu 400 Erfolgen (1 = gut) führte, während die zugrunde liegende Wahrscheinlichkeit unbekannt ist.p
Die naive Qualität in Bezug auf die Bewertungen des Verkäufers beträgt 80%, weil 0,8 = 400/500. Aber die "wahre" Qualität in Bezug auf Bewertungen, die wir nicht kennen.
Theoretisch könnte auch ein Verkäufer mit einer "wahren" Qualität von 400 von 500 Bewertungen erhalten haben.p=77%
Die spitze Balkengrafik im Bild gibt an, wie oft es in einer Simulation vorkam, dass für einen gegebenen angenommenen "wahren" 400 von 500 Bewertungen gut war. Das Balkendiagramm ist die Dichte des Histogramms des Simulationsergebnisses.p
Und wie Sie sehen können, umgibt die Dichtekurve der Beta-Verteilung für und (orange) das Balkendiagramm (die Dichte des Histogramms für die Simulation) eng.α=400+1 β=100+1
Die Beta-Verteilung definiert also im Wesentlichen die Wahrscheinlichkeit, dass die Erfolgswahrscheinlichkeit eines Bernoulli-Experiments bei gegebenem Ergebnis des Experiments ist .p
http://www.joyofdata.de/blog/an-intuitive-interpretation-der-beta-verteilung/
quelle
Bisher deckte das Überwiegen der Antworten die Gründe für Beta-RVs ab, die wie zuvor für Stichprobenanteile generiert wurden, und eine clevere Antwort bezog Beta-RVs auf Bestellstatistiken.
Beta-Verteilungen ergeben sich auch aus einer einfachen Beziehung zwischen zwei Gamma (k_i, 1) -RVs. I = 1,2 nennt sie X und Y. X / (X + Y) hat eine Beta-Verteilung.
Gamma-Wohnmobile haben bereits ihre Beweggründe bei der Modellierung der Ankunftszeiten für unabhängige Ereignisse, daher werde ich darauf nicht eingehen, da es nicht Ihre Frage ist. Ein "Bruchteil der Zeit", die aufgewendet wurde, um eine von zwei Aufgaben zu erledigen, die nacheinander ausgeführt wurden, bietet sich natürlich für eine Beta-Distribution an.
quelle
Meiner Intuition nach "wiegt" es sowohl den aktuellen Erfolgsanteil " " als auch den aktuellen Misserfolgsanteil " ": . Wobei die Konstante . Das ist wie ein "Gewicht" für den Beitrag des Erfolgs. Das ist wie ein "Gewicht" für den Beitrag des Scheiterns. Sie haben einen zweidimensionalen Parameterraum (einen für den Beitrag zum Erfolg und einen für den Beitrag zum Misserfolg), der es schwierig macht, darüber nachzudenken und es zu verstehen.x (1−x) f(x;α,β)=constant⋅xα−1(1−x)β−1 1/B(α,β) α β
quelle
Im genannten Beispiel lauten die Parameter Alpha = 81 und Beta = 219 aus dem Vorjahr [81 Treffer in 300 bei Fledermäusen oder (81 und 300 - 81 = 219)].
Ich weiß nicht, wie sie die vorherige Annahme von 81 Hits und 219 Outs nennen, aber auf Englisch ist das die A-priori-Annahme.
Beachten Sie, wie sich die Kurve im Verlauf der Saison nach links oder rechts und die Modalwahrscheinlichkeit nach links oder rechts verschiebt, aber es gibt immer noch eine Kurve.
Ich frage mich, ob die Laa of Large Numbers sich irgendwann durchsetzt und den Schlagdurchschnitt auf 0,270 zurückbringt.
Um das Alpha und Beta im Allgemeinen zu schätzen, würde man die vollständige Anzahl früherer Vorkommnisse (bei Fledermäusen) nehmen, den Schlagdurchschnitt als bekannt, die Gesamthits (das Alpha), das Beta oder die Gesamtsumme abzüglich der Ausfälle erhalten und voila - Du hast deine Formel. Bearbeiten Sie dann die zusätzlichen Daten wie gezeigt.
quelle
Die Beta-Verteilung ist sehr nützlich, wenn Sie mit der Partikelgrößenverteilung arbeiten. Dies ist nicht der Fall, wenn Sie eine Kornverteilung modellieren möchten. In diesem Fall ist es besser, die nicht rechts begrenzte Tanh-Verteilung .F(X)=tanh((x/p)n)
Übrigens, was ist los, wenn Sie eine Größenverteilung aus einer mikroskopischen Beobachtung erstellen und eine Partikelverteilung in der Anzahl haben und Ihr Ziel ist es, mit einer Volumenverteilung zu arbeiten? Es ist fast obligatorisch, die Originalverteilung in der rechts angegebenen Anzahl zu erhalten. Die Umwandlung ist also konsistenter, da Sie sicher sind, dass in der neuen Volumenverteilung weder ein Modus noch ein Median oder eine mittlere Größe außerhalb des Intervalls angezeigt wird, in dem Sie arbeiten. Außerdem vermeiden Sie den Grönland-Afrika-Effekt.
Die Transformation ist sehr einfach, wenn Sie regelmäßige Formen haben, dh eine Kugel oder ein Prisma. Sie sollten dem Alpha-Parameter der Zahl-Beta-Verteilung drei Einheiten hinzufügen und die Volumenverteilung erhalten.
quelle
Ich denke, hinter der Beta-Distribution steckt KEINE Intuition! Die Beta-Distribution ist nur eine sehr flexible Distribution mit FIX-Bereich! Und für Integer a und b ist es sogar einfach, damit umzugehen. Auch viele Sonderfälle der Beta haben ihre native Bedeutung, wie die Gleichverteilung. Wenn die Daten also so oder mit etwas mehr Flexibilität modelliert werden müssen, ist die Beta eine sehr gute Wahl.
quelle
In einer weiteren Frage zur Betaverteilung wird die folgende Intuition hinter der Betaverteilung gegeben:
Einzelheiten finden Sie in der vollständigen Antwort unter https://stats.stackexchange.com/a/429754/142758
quelle