Wir haben ein zufälliges Experiment mit verschiedenen Ergebnissen, die den Probenraum auf dem wir uns mit Interesse bestimmte Muster ansehen, die als eventsSigma-Algebren (oder Sigma-Felder) bestehen aus Ereignissen, denen ein Wahrscheinlichkeitsmaß zugeordnet werden kann. Bestimmte Eigenschaften werden erfüllt, einschließlich der Einbeziehung der Nullmenge und des gesamten Probenraums sowie einer Algebra, die Vereinigungen und Überschneidungen mit Venn-Diagrammen beschreibt.F . P ∅
Die Wahrscheinlichkeit ist definiert als eine Funktion zwischen der Algebra und dem Intervall . Insgesamt bildet das Tripel einen Wahrscheinlichkeitsraum .
Könnte jemand im Klartext erklären, warum das Wahrscheinlichkeitsgebäude zusammenbrechen würde, wenn wir keine Algebra hätten? Sie sind nur in der Mitte mit dem unmöglich kalligrafischen "F" eingeklemmt. Ich vertraue darauf, dass sie notwendig sind. Ich sehe, dass ein Ereignis sich von einem Ergebnis unterscheidet, aber was würde ohne Algebren schief gehen ?
Die Frage ist: Bei welcher Art von Wahrscheinlichkeitsproblemen wird die Definition eines Wahrscheinlichkeitsraums einschließlich einer Algebra zur Notwendigkeit?
Dieses Online-Dokument auf der Website der Dartmouth University bietet eine verständliche Erklärung. Die Idee ist ein sich drehender Zeiger, der sich im Gegenuhrzeigersinn auf einem Umkreis von Einheiten dreht :
Wir beginnen mit der Konstruktion einer Drehscheibe, die aus einem Kreis mit Einheitsumfang und einem Zeiger besteht, wie in der Abbildung gezeigt. Wir wählen einen Punkt auf dem Kreis und beschriften ihn mit und beschriften dann jeden zweiten Punkt auf dem Kreis mit dem Abstand, sagen wir , von bis zu diesem Punkt, gemessen gegen den Uhrzeigersinn. Das Experiment besteht aus dem Drehen des Zeigers und dem Aufzeichnen der Beschriftung des Punkts an der Spitze des Zeigers. Wir lassen die Zufallsvariable den Wert dieses Ergebnisses bezeichnen. Der Probenraum ist eindeutig das Intervall. Wir möchten ein Wahrscheinlichkeitsmodell aufbauen, bei dem jedes Ergebnis gleich wahrscheinlich ist. Wenn wir so vorgehen, wie wir es für Experimente mit einer endlichen Anzahl von möglichen [...] Ergebnissen getan haben, müssen wir jedem Ergebnis die Wahrscheinlichkeit zuweisen , da sonst die Summe der Wahrscheinlichkeiten über alle möglichen Ergebnisse nicht stimmt Gleich 1. (Tatsächlich ist das Summieren einer unzähligen Anzahl von reellen Zahlen eine heikle Angelegenheit. Insbesondere, damit eine solche Summe irgendeine Bedeutung hat, können höchstens abzählbare viele der Summanden von verschieden sein .) Wenn jedoch Alle zugewiesenen Wahrscheinlichkeiten sind , dann ist die Summe , nicht , wie es sein sollte.
Wenn wir also jedem Punkt eine Wahrscheinlichkeit zuweisen und voraussetzen, dass es eine (unzählige) Unendlichkeitszahl von Punkten gibt, würde sich ihre Summe zu summieren .
quelle
Antworten:
Zu Xi'ans erstem Punkt: Wenn Sie über Algebren sprechen , fragen Sie nach messbaren Mengen, daher muss sich jede Antwort auf die Maßtheorie konzentrieren. Ich werde aber versuchen, das sanft aufzubauen.σ
Eine Wahrscheinlichkeitstheorie, die alle Teilmengen unzähliger Mengen zulässt, wird die Mathematik durchbrechen
Betrachten Sie dieses Beispiel. Angenommen, Sie haben ein Einheitsquadrat in , und Sie interessieren sich für die Wahrscheinlichkeit, einen Punkt zufällig auszuwählen, der zu einer bestimmten Menge im Einheitsquadrat gehört. In vielen Fällen kann dies anhand eines Vergleichs der Bereiche der verschiedenen Mengen leicht beantwortet werden. Zum Beispiel können wir einige Kreise zeichnen, ihre Flächen messen und dann die Wahrscheinlichkeit als den Bruchteil des Quadrats nehmen, der in den Kreis fällt. Sehr einfach.R2
Was aber, wenn der Interessenbereich nicht genau definiert ist?
Wenn der Bereich nicht genau definiert ist, können wir zu zwei unterschiedlichen, aber in gewissem Sinne zutreffenden Schlussfolgerungen über den Bereich kommen. Wir könnten also einerseits und andererseits , was impliziert, dass . Dadurch wird die gesamte Mathematik irreparabel. Sie können jetzt und eine Reihe anderer absurder Dinge beweisen . Offensichtlich ist das nicht allzu nützlich.P ( A ) = 0 0 = 1 5 < 0P(A)=1 P(A)=0 0=1 5<0
Was genau ist eine Algebra? Es ist eigentlich nicht so erschreckend. Es ist nur eine Definition, welche Mengen als Ereignisse betrachtet werden können. Elemente, die nicht in , haben einfach kein definiertes Wahrscheinlichkeitsmaß. Grundsätzlich sind Algebren das "Patch", mit dem wir einige pathologische Verhaltensweisen der Mathematik vermeiden können, nämlich nicht messbare Mengen.F σσ F σ
Die drei Anforderungen eines Feldes können als Konsequenzen dessen betrachtet werden, was wir mit Wahrscheinlichkeit machen möchten : Ein Feld ist eine Menge, die drei Eigenschaften hat:σσ σ
Die abzählbaren Gewerkschaften und die abzählbaren Schnittmengenkomponenten sind direkte Konsequenzen des nicht messbaren Mengenproblems. Verschluß unter Komplemente ist eine Folge der Kolmogorov Axiome: wenn , sein sollte . Aber ohne (3) könnte es passieren, dass undefiniert ist. Das wäre komisch. Der Abschluss unter Ergänzungen und die Kolmogorov-Axiome lassen uns Dinge wie sagen .P(A)=2/3 P(Ac) 1/3 P(Ac) P(A∪Ac)=P(A)+1−P(A)=1
Schließlich berücksichtigen wir Ereignisse in Bezug auf , sodass wir weiterhin benötigen.Ω Ω∈F
Gute Nachricht: Algebren sind nur für unzählige Mengen unbedingt erforderlichσ
Aber! Auch hier gibt es gute Neuigkeiten. Oder zumindest eine Möglichkeit, das Problem zu umgehen. Wir brauchen nur Algebren, wenn wir in einer Menge mit unzähligen Kardinalitäten arbeiten. Wenn wir uns auf abzählbaren Mengen beschränken, dann können wir nehmen die Potenzmenge von , und wir werden keine dieser Probleme haben , weil für zählbare , besteht nur von messbaren Mengen. (Dies wird in Xi'ans zweitem Kommentar angedeutet.) Sie werden feststellen, dass einige Lehrbücher hier tatsächlich eine subtile Fingerfertigkeit zeigen und bei der Diskussion von Wahrscheinlichkeitsräumen nur abzählbare Mengen berücksichtigen.σ F=2Ω Ω Ω 2Ω
Außerdem ist es bei geometrischen Problemen in völlig ausreichend, nur Algebren zu berücksichtigen, die aus Mengen bestehen, für die das Maß definiert ist. Um dies etwas fester zu begründen, entspricht für den üblichen Begriffen von Länge, Fläche und Volumen. Was ich im vorherigen Beispiel sage, ist, dass die Menge einen genau definierten Bereich haben muss, damit ihr eine geometrische Wahrscheinlichkeit zugewiesen wird. Und der Grund ist: Wenn wir nicht meßbar Sätze zulassen, dann können wir in Situationen landen, wo wir eine Wahrscheinlichkeit von 1 zu einem Ereignisse auf einem gewissen Beweis basierend zuordnen können, und die Wahrscheinlichkeit 0 bis das gleichen Ereignisse Ereignis auf einem anderen Beweis basiert. σ L n L n n=1,2,3Rn σ Ln Ln n=1,2,3
Aber lassen Sie sich nicht von der Verbindung zu unzähligen Sets verwirren! Ein häufiges Missverständnis, dass Algebren abzählbare Mengen sind. Tatsächlich können sie zählbar oder unzählbar sein. Betrachten Sie diese Abbildung: Wie zuvor haben wir ein Einheitsquadrat. Definieren SieSie können ein Quadrat mit der Seitenlänge für alle und mit einer Ecke bei zeichnen . Es sollte klar sein, dass dieses Quadrat eine Teilmenge des Einheitsquadrats ist. Darüber hinaus haben alle diese Quadrate eine definierte Fläche, sodass diese Quadrate Elemente von . Es sollte aber auch klar sein, dass es unzählige Plätze gibtF = Alle Teilmengen des Einheitsquadrats mit definiertem L 2 -Maß . B s s ≤ ( 0 , 1 ) ( 0 , 0 ) F Bσ
In der Praxis ist es oft genug genug, diese Beobachtung zu machen, um festzustellen, dass Sie nur Lebesgue-messbare Mengen in Betracht ziehen, um das Problem des Interesses anzugehen.
Aber warten Sie, was ist eine nicht messbare Menge?
Ich fürchte, ich kann das nur ein bisschen beleuchten. Aber das Banach-Tarski-Paradoxon (manchmal das "Sonne-Erbsen" -Paradoxon) kann uns helfen:
Wenn Sie also mit Wahrscheinlichkeiten in und das geometrische Wahrscheinlichkeitsmaß (das Verhältnis der Volumina) verwenden, möchten Sie die Wahrscheinlichkeit eines Ereignisses berechnen. Aber Sie werden Schwierigkeiten haben, diese Wahrscheinlichkeit genau zu definieren, weil Sie die Mengen Ihres Raums neu anordnen können, um die Lautstärke zu ändern! Wenn die Wahrscheinlichkeit vom Volumen abhängt und Sie das Volumen des Sets so ändern können, dass es der Größe der Sonne oder der Größe einer Erbse entspricht, ändert sich auch die Wahrscheinlichkeit. Daher wird keinem Ereignis eine einzige Wahrscheinlichkeit zugeschrieben. Noch schlimmer ist , können Sie neu anordnen , so dass das Volumen der hat , was bedeutet , dass die geometrische Wahrscheinlichkeitsmaß meldet eine Wahrscheinlichkeit S∈ΩSV(S)>V(Ω)P(S)>1R3 S∈Ω S V(S)>V(Ω) P(S)>1 in offenkundiger Verletzung der Kolmogorov-Axiome, die diese Wahrscheinlichkeit erfordern, hat Maß 1.
Um dieses Paradoxon aufzulösen, könnte man eine von vier Zugeständnissen machen:
Option (1) hilft nicht beim Definieren von Wahrscheinlichkeiten, daher ist sie nicht verfügbar. Option (2) verstößt gegen das zweite Kolmogorov-Axiom. Option (3) scheint eine schreckliche Idee zu sein, da ZFC so viel mehr Probleme behebt, als es verursacht. Aber Option (4) scheint attraktiv: Wenn wir eine Theorie darüber entwickeln, was messbar ist und was nicht, dann werden wir in diesem Problem genau definierte Wahrscheinlichkeiten haben! Dies bringt uns zurück zur Maßtheorie und unseren Freund, die Algebra.σ
quelle
Die zugrunde liegende Idee (in sehr praktischen Begriffen) ist einfach. Angenommen, Sie sind Statistiker und arbeiten an einer Umfrage. Nehmen wir an, die Umfrage enthält einige Fragen zum Alter. Bitten Sie den Befragten jedoch nur, sein Alter in bestimmten Intervallen zu ermitteln, z. B. . Vergessen wir die anderen Fragen. Dieser Fragebogen definiert einen "Ereignisraum", Ihren . Die Sigma-Algebra kodiert alle Informationen, die aus dem Fragebogen erhalten werden können. Für die Altersfrage (und vorerst ignorieren wir alle anderen Fragen) enthält sie das Intervall aber keine anderen Intervalle wie[0,18),[18,25),[25,34),… (Ω,F) F [18,25) [20,30) , da wir aus den Informationen des Fragebogens nicht die Frage beantworten können, ob das Alter der Befragten zu oder nicht? Im Allgemeinen ist eine Menge ein Ereignis (gehört zu ), wenn und nur wenn wir entscheiden können, ob ein Abtastpunkt zu dieser Menge gehört oder nicht.[20,30) F
Definieren wir nun Zufallsvariablen mit Werten im zweiten Ereignisraum . Nehmen Sie als Beispiel, dass dies die reale Linie mit der üblichen (Borel) Sigma-Algebra ist. Dann ist eine (uninteressante) Funktion, die keine Zufallsvariable ist, "Das Alter der Befragten ist eine Primzahl" und kodiert dies als 1, wenn das Alter eine Primzahl ist, sonst als 0. Nein, nicht zu , daher ist keine Zufallsvariable. Der Grund ist einfach, wir können anhand der Informationen im Fragebogen nicht entscheiden, ob das Alter des Befragten am besten ist oder nicht! Jetzt können Sie selbst weitere interessante Beispiele machen.(Ω′,F′) f: f−1(1) F f
Warum muss eine Sigma-Algebra sein? Nehmen wir an, wir möchten zwei Fragen zu den Daten stellen: "Befragter Nummer 3, 18 Jahre oder älter", "Befragter 3, weiblich". Lassen Sie die Fragen zwei Ereignisse (Mengen in ) und , wobei die Mengen der Stichprobenpunkte diese Frage mit "Ja" beantworten. Lassen Sie uns nun die Verbindung der beiden Fragen „Ist die 3. Person eine Frau von 18 Jahren oder älter?“ Stellen. Diese Frage wird nun durch den eingestellten Schnittpunkt . In ähnlicher Weise werden Disjunktionen durch die MengenvereinigungF A B A ∩ B A ∪ BF F A B A∩B A∪B . Wenn wir nun die Geschlossenheit für zählbare Schnittstellen und Vereinigungen benötigen, können wir zählbare Konjunktionen oder Disjunktionen erfragen. Und das Negieren einer Frage wird durch die komplementäre Menge dargestellt. Das gibt uns eine Sigma-Algebra.
Ich habe diese Art der Einführung zuerst in dem sehr guten Buch von Peter Whittle "Wahrscheinlichkeit durch Erwartung" (Springer) gesehen.
BEARBEITEN
Der Versuch, die Frage von Whubers in einem Kommentar zu beantworten: "Als ich am Ende auf diese Behauptung stieß, war ich ein wenig verblüfft: 'Die Forderung nach Geschlossenheit für abzählbare Kreuzungen und Gewerkschaften lässt uns abzählbare Konjunktionen oder Disjunktionen stellen.' Dies scheint das Kernstück der Frage zu sein: Warum sollte jemand ein so unendlich kompliziertes Ereignis konstruieren wollen? "Nun, warum? Beschränken wir uns jetzt auf diskrete Wahrscheinlichkeiten, sagen wir aus Bequemlichkeitsgründen auf das Werfen von Münzen. Wenn wir die Münze endlich oft werfen, können alle Ereignisse, die wir mit der Münze beschreiben können, durch Ereignisse vom Typ "Kopf auf Wurf ", "Schwanz auf Wurf und eine endliche Anzahl von "und" oder "oder" ausgedrückt werden. In dieser Situation brauchen wir also keini σ σ n σ n σi i σ -Algebren, Algebren von Mengen ist genug. Gibt es in diesem Zusammenhang eine Situation, in der Algebren entstehen? In der Praxis entwickeln wir, selbst wenn wir die Würfel nur eine endliche Anzahl von Malen werfen können, Annäherungen an Wahrscheinlichkeiten über Grenzwertsätze, wenn , die Anzahl der Würfe, ungebunden wächst. Schauen Sie sich also den Beweis des zentralen Grenzwertsatzes für diesen Fall an, den Satz von Laplace-de-Moivre. Wir können durch Approximationen nur mit Algebren beweisen, dass keine Algebra benötigt werden sollte. Das schwache Gesetz der großen Zahlen kann durch die Ungleichung von Chebyshev bewiesen werden, und dafür brauchen wir nur die Varianz für endliche Fälle zu berechnen . Aber für das starke Gesetz der großen Zahlenσ n σ n Hat das von uns nachgewiesene Ereignis die Wahrscheinlichkeit, dass man es nur über eine unendliche Anzahl von "und" und "oder" ausdrücken kann, so benötigen wir für das starke Gesetz der großen Zahlen Algebren. σ
Aber brauchen wir wirklich das starke Gesetz der großen Zahlen? Nach einer Antwort hier vielleicht nicht.
In gewisser Weise weist dies auf einen sehr großen begrifflichen Unterschied zwischen dem starken und dem schwachen Gesetz großer Zahlen hin: Das starke Gesetz ist nicht direkt empirisch bedeutsam, da es sich um tatsächliche Konvergenz handelt, die empirisch niemals verifiziert werden kann. Das schwache Gesetz dagegen handelt davon, dass die Qualität der Approximation mit zunimmt , wobei numerische Grenzen für endliches , und ist daher empirisch aussagekräftiger.nn n
Alle praktischen Anwendungen diskreter Wahrscheinlichkeiten könnten also ohne Algebren auskommen. Für den kontinuierlichen Fall bin ich mir nicht so sicher.σ
quelle
Nun, es ist kein klarer Fall, aber es gibt einige gute Gründe dafür .
Warum brauchen Probabilisten Maßnahmen?
Die Leute bringen Vitalis Set und Banach-Tarski mit, um zu erklären, warum man Maßtheorie braucht, aber ich denke, das ist irreführend . Vitalis Menge verschwindet nur für (nicht-triviale) Maße, die translationsinvariant sind und die Wahrscheinlichkeitsräume nicht benötigen. Und Banach-Tarski erfordert Rotationsinvarianz. Analyseleute interessieren sich für sie, Probabilisten jedoch nicht .
Der Sinn der Maßtheorie in der Wahrscheinlichkeitstheorie besteht darin, die Behandlung von diskreten und kontinuierlichen Wohnmobilen zu vereinheitlichen und darüber hinaus gemischte Wohnmobile und Wohnmobile, die einfach keine sind, zuzulassen.
quelle