Bestimmen zwei Quantile einer Beta-Verteilung ihre Parameter?

9

Wenn ich zwei Quantile (q1,q2) und ihre entsprechenden Positionen (l1,l2) (jeweils) im offenen Intervall gebe (0,1), kann ich immer Parameter einer Beta-Verteilung finden, bei der diese Quantile vorliegen die angegebenen Standorte?

Bota
quelle
1
Nein, grundlegendes Gegenbeispiel (q1, q2) = (0,1) und (l1, l2) = (0,1), unabhängig von den Parametern.
Tim
1
@Tim Ich glaube, ich verstehe Ihren Standpunkt, aber Ihr Gegenbeispiel erfüllt nicht die von mir angegebenen Bedingungen (zum Beispiel, dass sich die Positionen im offenen Intervall befinden ). (0,1)
Bota
1
Ich denke, Sie können es numerisch tun (und es wird eine einzigartige Lösung geben), aber es würde einen kleinen Aufwand bedeuten.
Glen_b -State Monica
1
Ich denke auch - die numerische Lösung ist nicht schwierig, aber es ist nicht einfach, ein Argument für die Einzigartigkeit zu finden.
Elvis
1
@ Elvis tatsächlich, ich vermute, dass es eine Möglichkeit gibt, dies zu tun, indem man sich die Protokolle beider Variablen ansieht ( und q des OP ). lq
Glen_b -Rate State Monica

Antworten:

9

Die Antwort lautet Ja, vorausgesetzt, die Daten erfüllen offensichtliche Konsistenzanforderungen. Das Argument ist einfach und basiert auf einer einfachen Konstruktion, erfordert jedoch einige Einstellungen. Es kommt auf eine intuitiv ansprechende Tatsache an: Durch Erhöhen des Parameters a in einer Beta (a,b) -Verteilung wird der Wert seiner Dichte (PDF) für größeres x stärker erhöht als für kleineres x ; und das Erhöhen von b bewirkt das Gegenteil: Je kleiner x ist, desto mehr steigt der Wert des PDF.

Die Details folgen.


Das gewünschte q1 -Quantil sei x1 und das gewünschte q2 -Quantil sei x2 mit 1>q2>q1>0 und (daher) 1>x2>x1>0 . Dann gibt es eindeutige a und b für die die Beta (a,b) -Verteilung diese Quantile hat.

Die Schwierigkeit, dies zu demonstrieren, besteht darin, dass die Beta-Verteilung eine widerspenstige Normalisierungskonstante beinhaltet. Erinnern Sie sich an die Definition: Für a>0 und b>0 hat die Beta (a,b) -Verteilung eine Dichtefunktion (PDF)

f(x;a,b)=1B(a,b)xa1(1x)b1.

Die Normalisierungskonstante ist die Beta-Funktion

B(a,b)=01xa1(1x)b1dx=Γ(a)Γ(b)Γ(a+b).

Alles wird chaotisch, wenn wir versuchen, f(x;a,b) direkt in Bezug auf a und b , was der Brute-Force-Weg wäre, um eine Demonstration zu versuchen.

Eine Möglichkeit, die Beta-Funktion nicht analysieren zu müssen, besteht darin, zu beachten, dass Quantile relative Bereiche sind. Das ist,

qi=F(xi;a,b)=0xif(x;a,b)dx01f(x;a,b)dx

für i=1,2 . Hier sind beispielsweise die PDF und die kumulative Verteilungsfunktion (CDF) F eines Beta (1.15,0.57) Verteilung , für die x1=1/3 und q1=1/6 .

Abbildung 1

Links ist die Dichtefunktion xf(x;a,b) aufgetragen. q1 ist die Fläche unter der Kurve links von x1 , rot dargestellt, bezogen auf die Gesamtfläche unter der Kurve. q2 ist die Fläche links von x2 , die der Summe der roten und blauen Bereiche entspricht, wiederum relativ zur Gesamtfläche . Die CDF rechts zeigt, wie (x1,q1) und (x2,q2) markiere zwei verschiedene Punkte darauf.

In dieser Figur ist (x1,q1) wurde in festen (1/3,1/6) , a wurde ausgewählt , um 1.15 , und dann ein Wert von b wurde , für die festgestellt (x1,q1) liegt auf die Beta (a,b) CDF.

Lemma : Ein solches b kann immer gefunden werden.

Um genau zu sein, sei (x1,q1) ein für alle Mal festgelegt. (Sie bleiben die gleichen in den Abbildungen , die folgen: in allen drei Fällen die relative Fläche links von x1 gleich q1 .) Für jedes a>0 , das Lemma behauptet , dass es einen eindeutigen Wert von ist b , geschrieben b(a), für die x1 das q1 -Quantil der Beta ist (a,b(a)) Verteilung.

Um zu sehen warum, beachten Sie zuerst, dass sich bei Annäherung von b an Null die gesamte Wahrscheinlichkeit in der Nähe von Werten von 0 anhäuft, von wo aus F(x1;a,b) sich 1 nähert . Wenn sich b Unendlichkeit nähert, häufen sich alle Wahrscheinlichkeiten nahe den Werten von 1 , von wo aus sich F(x1;a,b)0 nähert . Dazwischen die Funktion bF(x1;a,b)nimmt in b streng zu .

Diese Behauptung ist geometrisch offensichtlich: Wenn wir die Fläche links unter der Kurve xxa1(1x)b1 relativ zur Gesamtfläche unter der Kurve betrachten und diese mit der vergleichen relative Fläche unter der Kurve xxa1(1x)b1 für b>b , dann ist die letztere Fläche relativ größer. Das Verhältnis dieser beiden Funktionen ist(1x)bb . Dies ist eine Funktion gleich1 , wennx=0, stetig zu fallen0 , wennx=1. Daherdie Höhen der Funktionxf(x;a,b) sindrelativ größerals die Höhen vonxf(x;a,b) fürx links vonx1 als fürx rechts vonx1. Folglich muss dieFlächelinks vonx1 im ersterenrelativgrößer sein als die Fläche rechts vonx1. (Dies lässt sich leicht mit einer Riemannschen Summe in ein rigoroses Argument übersetzen.)

Wir haben gesehen , daß die Funktion bf(x1;a,b) ist streng mit Grenzwerten bei monoton steigende 0 und 1 als b0 und b, jeweils. Es ist auch (eindeutig) kontinuierlich. Folglich existiert eine Zahl b(a) mit f(x1;a,b(a))=q1 und diese Zahl ist einzigartig und beweist das Lemma.

Das gleiche Argument zeigt, dass mit zunehmendem b die Fläche links von x2 zunimmt. Folglich reichen die Werte von f(x2;a,b(a)) über ein Intervall von Zahlen, während a von fast 0 bis fast . fortschreitet . Die Grenze von f(x2;a,b(a)) als a0 ist q1.

Hier ist ein Beispiel, in dem a nahe bei 0 (es entspricht 0.1 ). Mit x1=1/3 und q1=1/6 (wie in der vorherige Figur), b(a)0.02. Es gibt fast keinen Bereich zwischen x1 und x2:

Figure 2

Die CDF ist zwischen x1 und x2, praktisch flach , von wo aus q2 praktisch über q1. Im Grenzfall als a0 , q2q1.

Im anderen Extrem führen ausreichend große Werte von a zu F(x2;a,b(a)) beliebig nahe bei 1. Hier ist ein Beispiel mit (x1,q1) wie zuvor.

Figure 3

Hier ist a=8 und b(a) ist fast 10. Jetzt ist F(x2;a,b(a)) im Wesentlichen 1: Es gibt fast keinen Bereich rechts von x2.

Folglich kann man wählen beliebigen q2 zwischen q1 und 1 und stellt a bis F(x2;a,a(b))=q2. Nach wie vor muss dies a einzigartiges QED sein .


Der Arbeitscode Rzum Finden von Lösungen finden Sie unter Bestimmen der Beta-Verteilungsparameter und β aus zwei beliebigen Punkten (Quantilen)αβ .

whuber
quelle
Diese Antwort zeigt, dass wir, wenn wir ein festes oder b gewählt haben, einen eindeutigen entsprechenden Wert finden. Es wäre möglich, Funktionen zu konstruieren, die eine feste Fläche in [ 0 , x 1 ] , [ x 1 , x 2 ] und [ x 2 , 1 ] haben . Ich verstehe nicht sofort, warum dies garantieren würde, dass die Menge von α und β eindeutig ist. Würdest du bereit sein, mich auszuarbeiten und aufzuklären? ab[0,x1][x1,x2][x2,1]αβ
Januar
@ Jan Könnte erklären, was du mit der "Menge von und β " meinst ? Diese Symbole erscheinen nirgendwo in diesem Thread. αβ
whuber