Ich dachte über die Bedeutung der Familie auf der Ortsskala nach. Mein Verständnis ist, dass für jedes Mitglied einer Ortsskalenfamilie mit den Parametern Ort und Skala die Verteilung von nicht von irgendwelchen Parametern abhängt und für jedes dazugehörige Familie.
Meine Frage ist also, ob Sie ein Beispiel liefern können, bei dem zwei Zufallszahlen aus derselben Verteilungsfamilie standardisiert sind, dies jedoch nicht zu einer Zufallsvariablen mit derselben Verteilung führt.
Angenommen, und stammen aus derselben Verteilungsfamilie (wobei ich mit Familie zum Beispiel sowohl Normal als auch Gamma usw. meine). Definieren:
wir wissen, dass sowohl als auch die gleiche Erwartung und Varianz haben, .
Aber können sie unterschiedliche höhere Momente haben?
Mein Versuch, diese Frage zu beantworten, ist, dass wenn die Verteilung von und von mehr als 2 Parametern abhängt, als es sein könnte. Und ich denke an das verallgemeinerte , das 3 Parameter hat.
Wenn jedoch die Anzahl der Parameter und und aus derselben Verteilungsfamilie mit derselben Erwartung und Varianz stammen, bedeutet dies dann, dass und dieselbe Verteilung haben (höhere Momente)?
Antworten:
Es gibt anscheinend einige Verwirrung darüber, was eine Familie von Verteilungen ist und wie freie Parameter gegenüber freien plus festen (zugewiesenen) Parametern gezählt werden. Diese Fragen sind eine Seite, die nichts mit der Absicht des OP und dieser Antwort zu tun hat. Ich verwende das Wort Familie hier nicht, weil es verwirrend ist. Beispielsweise ist eine Familie gemäß einer Quelle das Ergebnis der Variation des Formparameters. @whuber gibt an, dass eine "Parametrisierung" einer Familie eine kontinuierliche Abbildung von einer Teilmenge von ℝ n mit ihrer üblichen Topologie in den Raum der Verteilungen ist, deren Bild diese Familie ist.n Ich werde die Wortform verwenden , die sowohl die beabsichtigte Verwendung des Wortes abdecktFamilien- und Parameteridentifikation und -zählung. Zum Beispiel hat die Formelx2−2x+4 die Form einer quadratischen Formel, dha2x2+a1x+a0 und wenna1=0 die Formel immer noch eine quadratische Form. Wenn jedocha2=0 Die Formel ist linear und die Form ist nicht mehr vollständig genug, um einen quadratischen Formterm zu enthalten. Diejenigen, die das Wort Familie in einem angemessenen statistischen Kontext verwenden möchten, werden aufgefordert, zu dieser separaten Frage beizutragen .
Beantworten wir die Frage "Können sie unterschiedliche höhere Momente haben?". Es gibt viele solcher Beispiele. Wir stellen nebenbei fest, dass es sich anscheinend um symmetrische PDFs handelt, bei denen es sich im einfachen Fall mit zwei Parametern tendenziell um Position und Skalierung handelt. Die Logik: Angenommen, es gibt zwei Dichtefunktionen mit unterschiedlichen Formen mit zwei identischen Parametern (Position, Skalierung). Dann gibt es entweder einen Formparameter, der die Form anpasst, oder die Dichtefunktionen haben keinen gemeinsamen Formparameter und sind somit Dichtefunktionen ohne gemeinsame Form.
Hier ist ein Beispiel dafür, wie der Formparameter darin dargestellt wird. Die verallgemeinerte Fehlerdichtefunktion und hier ist eine Antwort, die eine frei wählbare Kurtosis zu haben scheint.
Von Skbkekas - Eigene Arbeit, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=6057753
Die PDF-Funktion (AKA "Wahrscheinlichkeits" -Dichtefunktion, beachten Sie, dass das Wort "Wahrscheinlichkeit" überflüssig ist) istβ2αΓ(1β)e−(|x−μ|α)β
Der Mittelwert und die Position sindμ , die Skala ist α und β ist die Form. Beachten Sie, dass es einfacher ist, symmetrische PDFs darzustellen, da diese PDFs häufig Position und Skalierung als einfachste zwei Parameterfälle haben, während asymmetrische PDFs wie die Gamma-PDF-Datei tendenziell Form und Skalierung als einfachste Fallparameter haben. In Fortsetzung der Fehlerdichtefunktion beträgt die Varianz α2Γ(3β)Γ(1β) ist die Schiefe0 und die Kurtosis istΓ(5β)Γ(1β)Γ(3β)2−3 . Wenn wir also die Varianz auf 1 setzen, weisen wir den Wert vonα ausα2=Γ(1β)Γ(3β) unter Variation vonβ>0 , so dass die Kurtosis im Bereich von−0.601114 bis∞ wählbar ist.
Das heißt, wenn wir Momente höherer Ordnung variieren wollen und wenn wir einen Mittelwert von Null und eine Varianz von 1 beibehalten wollen, müssen wir die Form variieren. Dies impliziert drei Parameter, die im Allgemeinen 1) den Mittelwert oder auf andere Weise das geeignete Maß für den Ort, 2) die Skala zur Anpassung der Varianz oder ein anderes Maß für die Variabilität und 3) die Form sind. Es braucht mindestens drei Parameter, um es zu tun.
Beachten Sie, dass, wenn wir die Substitutionenβ=2 vornehmen , α=2–√σ im obigen PDF erhalten wire−(x−μ)22σ22π−−√σ,
Dies ist die Dichtefunktion einer Normalverteilung. Somit ist die verallgemeinerte Fehlerdichtefunktion eine Verallgemeinerung der Dichtefunktion der Normalverteilung. Es gibt viele Möglichkeiten, die Dichtefunktion einer Normalverteilung zu verallgemeinern. Ein weiteres Beispiel, aber mit der Dichtefunktion der Normalverteilung nur als Grenzwert, und nicht mit Mid-Range - Substitutionswerte wie die verallgemeinerte Fehlerdichtefunktion, ist der Student−t ‚s Dichtefunktion. Der unter Verwendung des Studenten −t Dichtefunktion, würden wir eine etwas eingeschränkte Auswahl an Kurtosis haben, und df≥2 ist der Formparameter , da der zweite Moment nicht vorhanden df<2 . Darüber hinaus ist df nicht auf positive ganzzahlige Werte beschränkt, sondern im Allgemeinen real ≥1 . Das Student's −t nur im Limit als df→∞ normal , weshalb ich es nicht als Beispiel gewählt habe. Es ist weder ein gutes Beispiel noch ein Gegenbeispiel, und darin stimme ich @ Xi'an und @whuber nicht zu.
Lassen Sie mich das weiter erklären. Man kann zwei von vielen willkürlichen Dichtefunktionen zweier Parameter auswählen, um beispielsweise einen Mittelwert von Null und eine Varianz von Eins zu haben. Sie werden jedoch nicht alle dieselbe Form haben. Die Frage bezieht sich jedoch auf Dichtefunktionen der gleichen Form, nicht auf verschiedene Formen. Es wurde behauptet, dass die Dichtefunktionen, die dieselbe Form haben, eine willkürliche Zuordnung sind, da dies eine Frage der Definition ist und sich meine Meinung darin unterscheidet. Ich stimme nicht zu, dass dies willkürlich ist, weil man entweder eine Substitution vornehmen kann, um eine Dichtefunktion in eine andere umzuwandeln, oder man kann nicht. Im ersten Fall sind die Dichtefunktionen ähnlich, und wenn wir durch Substitution zeigen können, dass die Dichtefunktionen nicht äquivalent sind, dann haben diese Dichtefunktionen unterschiedliche Form.
So das Beispiel des Studenten mit−t PDF, sind die Entscheidungen entweder betrachten es als eine Verallgemeinerung eines normalen PDF sein, in welchem Fall eine normale PDF eine zulässige Form für einen Student hat −t ‚s PDF, oder nicht, in welchem Fall des Studenten −t PDF s‘ist eine andere Form von der normalen PDF und ist somit irrelevant für die Frage gestellt .
Wir können dies auf viele Arten argumentieren. Meine Meinung ist , dass ein normales PDF ist ein Teil gewählte Form eines Schülers−t ‚s PDF, sondern dass ein normales PDF ist keine Unter Auswahl eines Gamma - PDF obwohl ein Grenzwert eines Gamma PDF angezeigt werden kann Seien Sie ein normales PDF, und mein Grund dafür ist, dass im normalen / Student ' −t Fall die Unterstützung dieselbe ist, aber im normalen / Gamma-Fall ist die Unterstützung unendlich gegenüber halb unendlich, was die erforderliche Inkompatibilität darstellt .
quelle
Wenn Sie ein Beispiel wünschen, bei dem es sich um eine "offiziell benannte parametrisierte Verteilungsfamilie" handelt, können Sie sich die verallgemeinerte Gammaverteilung ansehen: https://en.wikipedia.org/wiki/Generalized_gamma_distribution . Diese Verteilungsfamilie verfügt über drei Parameter, sodass Sie den Mittelwert festlegen können und Varianz und haben immer noch die Freiheit, höhere Momente zu variieren. Auf der Wiki-Seite sieht die Algebra nicht einladend aus, ich würde es lieber numerisch machen. Für statistische Anwendungen durchsuchen Sie diese Site nach gamlss, einer Erweiterung von gam (generalisiertes Additiv) Modelle, an sich eine Verallgemeinerung von glm's), die Parameter für "Ort, Maßstab und Form" haben.
Another example is thet -distributions, extended to be a location-scale family. Then the third parameter will be the degrees of freedom, which will wary the shape for a fixed location and scale.
quelle
There is an infinite number of distributions with mean zero and variance one, hence takeϵ1 distributed from one of these distributions, say the N(0,1) , and ϵ2 from another of these distributions, say the Student's t with 54 degrees of freedom rescaled by 13−−√ so that its variance is one, then
Obviously, if you set further rules to the definition of this family, like stating for instance that there exists a fixed densityf such that the density of X is
quelle
I think you are asking whether two random variables coming from the same location-scale family can have the same mean and variance, but at least one different higher moment. The answer is no.
Proof: LetX1 and X2 be two such random variables. Since X1 and X2 are in the same location-scale family, there exist a random variable X and real numbers a1>0,a2>0,b1,b2 such that X1=da1X+b1 and X2=da2X+b2 . Since X1 and X2 have the same mean and variance, we have:
IfVar[X]=0 , then X1=E[X1]=X2=E[X2] with probability 1 , and hence the higher moments of X1 and X2 are all equal. So we may assume that Var[X]≠0 . Using this, (2) implies that |a1|=|a2| . Since a1>0 and a2>0 , we have in fact that a1=a2 . In turn, (1) above now implies that b1=b2 . We therefore have that:
quelle
Since the question can be interpreted in multipe ways I will split this answer into two parts.
The problem with case A can be easily answered/demonstrated by many families with a shape parameter.
The problem with case B is more difficult since one and a half parameters seem to be sufficient to specify location and scale (location inR and scale in R>0 ), and the problem becomes whether two parameters can be used to encode (multiple) shapes in addition as well. This is not so trivial. We can easily come up with specific two parameter location scale families and demonstrate that you do not have different shapes, but it does not proof that this is a fixed rule for any two parameter location scale family.
A: Can two different distributions from the same 2 parameter distribution family have the same mean and variance?
The answer is yes and it can already be shown using one of the explicitly mentioned examples: the normalized Gamma distribution
Family of normalized gamma distributions
LetZ=X−μσ with X a Gamma distributed variable. The (cumulative) distribution of Z is as below:
whereγ is the incomplete gamma function.
So here it is clearly the case that differentZ1 and Z2 (distributions from the family of normalized gamma distributions) can have same mean and variance (namely μ=0 and σ=1 ) but differ based on the parameter k (often denoted 'shape' parameter). This is closely linked to the fact that the family of gamma distributions is not a location-scale family.
B: Can two different distributions from the same 2 parameter location-scale distribution family have the same mean and variance?
I believe that the answer is no if we consider only smooth families (smooth: a small change in the parameters will result in a small change of the distribution/function/curve). But that answer is not so trivial and when we would use more general (non-smooth) families then we can say yes, although these families only exist in theory and have no practical relevance.
Generating a location-scale family from a single distribution by translation and scaling
From any particular single distribution we can generate a location-scale family by translation and scaling. Iff(x) is the probability density function of the single distribution, then the probability density function for a member of the family will be
For a location-scale family that can be generated in such way we have:
Can for all two parameter location-scale families their member distributions be generated from a single member distribution by translation and scaling?
So translation and scaling can convert a single distribution into a location-scale family. The question is whether the reverse is true and whether every two parameter location-scale family (where the parametersθ1 and θ2 do not necessarily need to coincide with the location μ and scale σ ) can be described by a translation and scaling of a single member from that family.
For particular two parameter location-scale families like the family of normal distributions it is not too difficult to show that they can be generated according to the process above (scaling and translating of single example member).
One may wonder whether it is possible for every two parameter location-scale family to be generated out of a single member by translation and scaling. Or a conflicting statement: "Can a two parameter location-scale family contain two different member distributions with the same mean and variance?", for which it would be necessary that the family is a union of multiple subfamilies that are each generated by translation and scaling.
Case 1: Family of generalized Students' t-distributions, parameterized by two variables
A contrived example occurs when we make some mapping fromR2 into R3 (cardinality-of-mathbbr-and-mathbbr2) which allows the freedom to use two parameters θ1 and θ2 to describe a union of multiple subfamilies that are generated by translation and scaling.
Let's use the (three parameter) generalized Student's t-distribution:
with the three parameters changed as followingμσν===tan(θ1)θ2⌊0.5+θ1/π⌋
then we have
which may be considered a two parameter location-scale family (albeit not very useful) that can not be generated by translation and scaling of only a single member.
Case 2: Location-scale families generated by negative scaling of a single distribution with nonzero skew
A less contrived example, than using this tan-function, is given by Whuber under the comments of Carl's answer. We can have a familyx↦f(x/b+a) where flipping the sign of b keeps the mean and variance unchanged but possibly changing the uneven higher moments. So this gives a bit more easily a two parameter location-scale family where members with the same mean and variance can have different higher order moments. This example from Whuber can be split into two subfamilies each of which can be generated out of a single member by translation and scaling.
Smooth families
If we try to make a single smooth two parameter distribution family (smooth: a small change in the parameters will result in a small change of the distribution/function/curve) by somehow making a composition of two or more families that are generated by translation and scaling, then we get into problems to have the two parameters cover both the variation of 'mean' and 'variance', as well as the third parameter 'shape'. A formal proof will have to go along the same lines as the answer to the question: Is there a smooth surjective functionf:R2↦R3 ? (where the answer is no in the case of smooth, ie. infinitely differentiable, functions although there are continuous functions that would do the job such as Peano curves).
Intuition: Imagine there would be some parametersθ1 , θ2 that describe the distributions in some location-scale distribution family and by which we can change the mean and variance as well as some other moments, then we should be able to express θ1 , θ2 , in terms of the mean μ and variance σ
but these need to be multiple valued functions and these can not make continuous transitions, the different values fromfθ1(μ,σ) for a particular μ and σ are not continuous, and will not be able to model a continuous shape parameter.
I am actually not so sure about this final part. We could possibly use a space-filling curve (such as the Peano curve, if only we knew how to express coordinates on the curve to coordinates of the hypercube) to have a single parameterθ1 completely model multiple features like mean and variance, without giving up the property that a small change of the parameter θ1 is equivalent to a small change of the function f(x;θ1) at every x
quelle