Wenn ich zwei Quantile und ihre entsprechenden Positionen (jeweils) im offenen Intervall gebe , kann ich immer Parameter einer Beta-Verteilung finden, bei der diese Quantile vorliegen die angegebenen Standorte?
9
Wenn ich zwei Quantile und ihre entsprechenden Positionen (jeweils) im offenen Intervall gebe , kann ich immer Parameter einer Beta-Verteilung finden, bei der diese Quantile vorliegen die angegebenen Standorte?
Antworten:
Die Antwort lautet Ja, vorausgesetzt, die Daten erfüllen offensichtliche Konsistenzanforderungen. Das Argument ist einfach und basiert auf einer einfachen Konstruktion, erfordert jedoch einige Einstellungen. Es kommt auf eine intuitiv ansprechende Tatsache an: Durch Erhöhen des Parametersa in einer Beta (a,b) -Verteilung wird der Wert seiner Dichte (PDF) für größeres x stärker erhöht als für kleineres x ; und das Erhöhen von b bewirkt das Gegenteil: Je kleiner x ist, desto mehr steigt der Wert des PDF.
Die Details folgen.
Die Schwierigkeit, dies zu demonstrieren, besteht darin, dass die Beta-Verteilung eine widerspenstige Normalisierungskonstante beinhaltet. Erinnern Sie sich an die Definition: Füra > 0 und b > 0 hat die Beta ( a , b ) -Verteilung eine Dichtefunktion (PDF)
Die Normalisierungskonstante ist die Beta-Funktion
Alles wird chaotisch, wenn wir versuchen,f( x ; a , b ) direkt in Bezug auf ein und b , was der Brute-Force-Weg wäre, um eine Demonstration zu versuchen.
Eine Möglichkeit, die Beta-Funktion nicht analysieren zu müssen, besteht darin, zu beachten, dass Quantile relative Bereiche sind. Das ist,
füri = 1 , 2 . Hier sind beispielsweise die PDF und die kumulative Verteilungsfunktion (CDF) F. eines Beta ( 1,15 , 0,57 ) Verteilung , für die x1= 1 / 3 und q1= 1 / 6 .
Links ist die Dichtefunktionx → f( x ; a , b ) aufgetragen. q1 ist die Fläche unter der Kurve links von x1 , rot dargestellt, bezogen auf die Gesamtfläche unter der Kurve. q2 ist die Fläche links von x2 , die der Summe der roten und blauen Bereiche entspricht, wiederum relativ zur Gesamtfläche . Die CDF rechts zeigt, wie ( x1, q1) und ( x2, q2) markiere zwei verschiedene Punkte darauf.
In dieser Figur ist( x1, q1) wurde in festen ( 1 / 3 , 1 / 6 ) , ein wurde ausgewählt , um 1.15 , und dann ein Wert von b wurde , für die festgestellt ( x1, q1) liegt auf die Beta ( a , b ) CDF.
Lemma : Ein solchesb kann immer gefunden werden.
Um genau zu sein, sei( x1, q1) ein für alle Mal festgelegt. (Sie bleiben die gleichen in den Abbildungen , die folgen: in allen drei Fällen die relative Fläche links von x1 gleich q1 .) Für jedes a>0 , das Lemma behauptet , dass es einen eindeutigen Wert von ist b , geschrieben b(a), für die x1 das q1 -Quantil der Beta ist (a,b(a)) Verteilung.
Um zu sehen warum, beachten Sie zuerst, dass sich bei Annäherung vonb an Null die gesamte Wahrscheinlichkeit in der Nähe von Werten von 0 anhäuft, von wo aus F(x1;a,b) sich 1 nähert . Wenn sich b Unendlichkeit nähert, häufen sich alle Wahrscheinlichkeiten nahe den Werten von 1 , von wo aus sich F(x1;a,b) 0 nähert . Dazwischen die Funktion b→F(x1;a,b) nimmt in b streng zu .
Diese Behauptung ist geometrisch offensichtlich: Wenn wir die Fläche links unter der Kurvex→xa−1(1−x)b−1 relativ zur Gesamtfläche unter der Kurve betrachten und diese mit der vergleichen relative Fläche unter der Kurve x→xa−1(1−x)b′−1 für b′>b , dann ist die letztere Fläche relativ größer. Das Verhältnis dieser beiden Funktionen ist(1−x)b′−b . Dies ist eine Funktion gleich1 , wennx=0, stetig zu fallen0 , wennx=1. Daherdie Höhen der Funktionx→f(x;a,b′) sindrelativ größerals die Höhen vonx→f(x;a,b) fürx links vonx1 als fürx rechts vonx1. Folglich muss dieFlächelinks vonx1 im ersterenrelativgrößer sein als die Fläche rechts vonx1. (Dies lässt sich leicht mit einer Riemannschen Summe in ein rigoroses Argument übersetzen.)
Wir haben gesehen , daß die Funktionb→f(x1;a,b) ist streng mit Grenzwerten bei monoton steigende 0 und 1 als b→0 und b→∞, jeweils. Es ist auch (eindeutig) kontinuierlich. Folglich existiert eine Zahl b(a) mit f(x1;a,b(a))=q1 und diese Zahl ist einzigartig und beweist das Lemma.
Das gleiche Argument zeigt, dass mit zunehmendemb die Fläche links von x2 zunimmt. Folglich reichen die Werte von f(x2;a,b(a)) über ein Intervall von Zahlen, während a von fast 0 bis fast ∞. fortschreitet . Die Grenze von f(x2;a,b(a)) als a→0 ist q1.
Hier ist ein Beispiel, in dema nahe bei 0 (es entspricht 0.1 ). Mit x1=1/3 und q1=1/6 (wie in der vorherige Figur), b(a)≈0.02. Es gibt fast keinen Bereich zwischen x1 und x2:
Die CDF ist zwischenx1 und x2, praktisch flach , von wo aus q2 praktisch über q1. Im Grenzfall als a→0 , q2→q1.
Im anderen Extrem führen ausreichend große Werte vona zu F(x2;a,b(a)) beliebig nahe bei 1. Hier ist ein Beispiel mit (x1,q1) wie zuvor.
Hier ista=8 und b(a) ist fast 10. Jetzt ist F(x2;a,b(a)) im Wesentlichen 1: Es gibt fast keinen Bereich rechts von x2.
Folglich kann man wählen beliebigenq2 zwischen q1 und 1 und stellt a bis F(x2;a,a(b))=q2. Nach wie vor muss dies a einzigartiges QED sein .
Der Arbeitscodeα β .
R
zum Finden von Lösungen finden Sie unter Bestimmen der Beta-Verteilungsparameter und β aus zwei beliebigen Punkten (Quantilen)quelle