Vor ein paar Jahren habe ich einen Strahlungsdetektor entwickelt, der das Intervall zwischen Ereignissen misst, anstatt sie zu zählen. Ich ging davon aus, dass ich bei der Messung nicht zusammenhängender Proben im Durchschnitt die Hälfte des tatsächlichen Intervalls messen würde. Als ich die Schaltung jedoch mit einer kalibrierten Quelle testete, war der Messwert um den Faktor zwei zu hoch, was bedeutete, dass ich das gesamte Intervall gemessen hatte.
In einem alten Buch über Wahrscheinlichkeit und Statistik habe ich einen Abschnitt über etwas namens "Das wartende Paradoxon" gefunden. Es wurde ein Beispiel vorgestellt, bei dem ein Bus alle 15 Minuten an der Bushaltestelle ankommt und ein Fahrgast zufällig ankommt. Es wurde angegeben, dass der Fahrgast im Durchschnitt die vollen 15 Minuten warten würde. Ich war noch nie in der Lage, die mit dem Beispiel vorgestellte Mathematik zu verstehen und weiterhin nach einer Erklärung zu suchen. Wenn jemand erklären kann, warum es so ist, dass der Passagier das volle Intervall wartet, schlafe ich besser.
quelle
Antworten:
Wie Glen_b ausführte, wissen wir, dass die maximal mögliche Wartezeit Minuten beträgt , wenn die Busse alle Minuten ohne jegliche Unsicherheit ankommen . Wenn wir unsererseits "zufällig" ankommen, haben wir das Gefühl, dass wir "im Durchschnitt" die Hälfte der maximal möglichen Wartezeit abwarten werden . Dabei ist die maximal mögliche Wartezeit gleich der maximal möglichen Länge zwischen zwei aufeinanderfolgenden Ankünften. Geben Sie unsere Wartezeit und die maximale Länge zwischen zwei aufeinanderfolgenden Busankünften , und wir argumentieren dies15 15 W R
und wir haben recht.
Aber plötzlich wird uns die Gewissheit genommen und uns wird gesagt, dass Minuten nun die durchschnittliche Länge zwischen zwei Busankünften sind. Und wir geraten in die "intuitive Denkfalle" und denken: "Wir müssen nur durch seinen erwarteten Wert ersetzen ", und wir argumentieren15 R
Ein erster Hinweis darauf , dass wir falsch sind, ist , dass ist nicht „Länge zwischen zwei beliebigen aufeinanderfolgenden Bus-Arrivals“, ist es „ maximale Länge etc“. Wir haben also auf jeden Fall das .R E(R)≠15
Wie sind wir zu Gleichung ? Wir dachten: "Wartezeit kann von bis maximal . Ich komme mit der gleichen Wahrscheinlichkeit in jedem Fall an, also" wähle "ich zufällig und mit der gleichen Wahrscheinlichkeit alle möglichen Wartezeiten. Daher ist die Hälfte der maximalen Länge zwischen zwei aufeinanderfolgenden Busankünften meine durchschnittliche Wartezeit ". Und wir haben recht.(1) 0 15
Indem Sie jedoch versehentlich den Wert in Gleichung einfügen , spiegeln Sie unser Verhalten nicht mehr wider. Mit anstelle von sagt Gleichung : "Ich wähle zufällig und mit gleicher Wahrscheinlichkeit alle möglichen Wartezeiten aus , die kleiner oder gleich der durchschnittlichen Länge zwischen zwei aufeinanderfolgenden Busankünften sind. " fehler liegt daran, dass sich unser verhalten nicht geändert hat - so dass wir durch zufälliges gleichmäßiges ankommen in der realität immer noch alle möglichen wartezeiten "zufällig und mit gleicher wahrscheinlichkeit auswählen" - aber "alle möglichen wartezeiten" werden nicht von erfasst15 (2) 15 E(R) (2) 15 - Wir haben den rechten Teil der Längenverteilung zwischen zwei aufeinanderfolgenden Busankünften vergessen.
Vielleicht sollten wir den erwarteten Wert der maximalen Länge zwischen zwei aufeinanderfolgenden Busankünften berechnen. Ist dies die richtige Lösung?
Ja, das könnte sein, aber : das spezifische "Paradoxon" geht einher mit einer spezifischen stochastischen Annahme: Busankünfte werden nach dem Benchmark-Poisson-Verfahren modelliert, was bedeutet, dass wir als Konsequenz davon ausgehen, dass die Zeitspanne zwischen Zwei aufeinanderfolgende Busankünfte folgen einer Exponentialverteilung. Bezeichne diese Länge, und wir haben dasℓ
Dies ist natürlich ungefähr, da die Exponentialverteilung von rechts unbegrenzte Unterstützung hat, was bedeutet, dass unter dieser Modellannahme streng genommen "alle möglichen Wartezeiten" größere und große Größen bis "einschließlich" unendlich, aber mit verschwindender Wahrscheinlichkeit, einschließen .
Aber warte, das Exponential ist memorylos : Egal zu welchem Zeitpunkt wir ankommen, wir stehen vor der gleichen Zufallsvariablen , unabhängig davon, was vorhergegangen ist.
Angesichts dieser stochastischen / Verteilungsannahme ist jeder Zeitpunkt Teil eines "Intervalls zwischen zwei aufeinanderfolgenden Busankünften", dessen Länge durch die gleiche Wahrscheinlichkeitsverteilung mit dem erwarteten Wert (nicht dem Maximalwert) : "Ich bin hier, ich bin Umgeben von einem Intervall zwischen zwei Busankünften. Ein Teil seiner Länge liegt in der Vergangenheit und ein anderer in der Zukunft, aber ich habe keine Möglichkeit zu wissen, wie viel und wie viel. Das Beste, was ich tun kann, ist zu fragen, wie lang es voraussichtlich sein wird. was wird meine durchschnittliche Wartezeit sein? " - Und die Antwort ist leider immer " ".15 15
quelle
Wenn der Bus "alle 15 Minuten" (dh nach einem Zeitplan) ankommt, beträgt die durchschnittliche Wartezeit des (zufällig ankommenden) Fahrgasts tatsächlich nur 7,5 Minuten, da sie in dieser 15-Minuten-Lücke gleichmäßig verteilt wird.
-
Wenn der Bus hingegen zufällig mit einer durchschnittlichen Geschwindigkeit von 4 pro Stunde ankommt (dh nach einem Poisson-Verfahren), ist die durchschnittliche Wartezeit viel länger. in der Tat können Sie es über das Fehlen von Speichereigenschaften herausfinden. Nehmen Sie die Ankunft des Passagiers als Start, und die Zeit bis zum nächsten Ereignis ist mit durchschnittlich 15 Minuten exponentiell.
Lassen Sie mich eine diskrete Zeitanalogie ziehen. Man stelle ich eine Düse mit 15 Flächen am Walzgut, von denen einer markiert ist „B“ (für Bus) und 14 „X“ für die völlige Abwesenheit von Bus markiert , die Minute (fair 30 seitige Würfel vorhanden ist , so dass ich 2 des Etiketts Flächen eines 30-seitigen Stempels "B"). Also rolle ich einmal pro Minute und sehe, ob der Bus kommt. Der Würfel hat kein Gedächtnis; Es weiß nicht, wie viele Rollen es seit dem letzten "B" gegeben hat. Stellen Sie sich nun vor, ein unverbundenes Ereignis passiert - ein Hund bellt, ein Passagier kommt, ich höre ein Donnergrollen. Wie lange warte ich ab jetzt (wie viele Brötchen) bis zum nächsten "B"?
Wegen des Speichermangels warte ich im Durchschnitt dieselbe Zeit auf das nächste "B" wie zwischen zwei aufeinanderfolgenden "B".
[Als nächstes stelle ich mir vor, ich würde alle fünfzehn Sekunden einen 60-seitigen Würfel werfen (wieder mit einem "B" -Gesicht); Stellen Sie sich jetzt vor, ich hätte einen 1000-seitigen Würfel, den ich alle 0,9 Sekunden gewürfelt habe (mit einem "B" -Fläche; oder realistischerweise drei 10-seitige Würfel), und ich bezeichne das Ergebnis als "B", wenn alle 3 "10" ergeben zur gleichen Zeit) ... und so weiter. Im Limit erhalten wir den zeitkontinuierlichen Poisson-Prozess.]
Eine andere Sichtweise ist die folgende: Ich beobachte mein Ereignis "Start Counting Rolls" (dh "Der Fahrgast kommt an der Bushaltestelle an") mit größerer Wahrscheinlichkeit während einer längeren Pause als einer kurzen, und zwar auf die richtige Weise Die durchschnittliche Wartezeit ist die gleiche wie die durchschnittliche Zeit zwischen den Bussen (ich warte meistens in langen Lücken und verpasse meistens die kürzesten). Da ich zu einer gleichmäßig verteilten Zeit komme, ist die Chance, in einer Lücke der Länge anzukommen, proportional zu )t t
Als erfahrener Busfänger scheint die Realität in der Praxis irgendwo zwischen „Busse treffen nach Fahrplan ein“ und „Busse treffen nach dem Zufallsprinzip ein“ zu liegen. Und manchmal (bei schlechtem Verkehr) wartet man eine Stunde, bis 3 auf einmal eintreffen (Zach nennt den Grund dafür in den Kommentaren unten).
quelle
Mehr zu Bussen ... Es tut mir leid, dass ich mich so spät in die Diskussion einmische, aber ich habe mir in letzter Zeit die Poisson-Prozesse angeschaut ... Bevor es mir also aus dem Kopf geht, hier eine bildliche Darstellung des Inspektionsparadoxons :
Der Irrtum rührt von der Annahme her, dass Busse, da sie einem bestimmten Ankunftsmuster mit einer bestimmten durchschnittlichen Ankunftszeit folgen (die Umkehrung des Poisson-Ratenparameters , nennen wir es min. ), wenn Sie zu einer beliebigen Zeit an der Bushaltestelle auftauchen, holen Sie tatsächlich einen Bus ab. Wenn Sie also zu zufälligen Zeiten am Busbahnhof auftauchen und ein Logbuch mit den Wartezeiten von beispielsweise einem Monat führen, erhalten Sie die durchschnittliche Ankunftszeit zwischen den Bussen. Aber das würdest du nicht tun.λ θ=1/λ=15
Wenn wir uns in einem Versandzentrum befänden und alle Busse auf einem Bildschirm sehen könnten, ergäbe die zufällige Aufnahme mehrerer Busse und die Durchschnittsentfernung zu dem nachfolgenden Bus die durchschnittliche Ankunftszeit:
Aber wenn wir stattdessen nur an der Bushaltestelle auftauchen (anstatt einen Bus auszuwählen), machen wir an einem typischen Morgen einen zufälligen Zeitquerschnitt entlang der Zeitachse des Busfahrplans. Die Zeit, die wir an der Bushaltestelle verbringen möchten, kann durchaus gleichmäßig auf den "Pfeil" der Zeit verteilt sein. Da es jedoch längere Zeitabstände zwischen weiter auseinander liegenden Bussen gibt, ist es wahrscheinlicher, dass wir diese "Straggler" überbemustern:
... und daher spiegelt unser Wartezeit-Logbuch nicht die Zwischenankunftszeit wider. Dies ist das Inspektionsparadoxon.
Was die eigentliche Frage des OP nach der erwarteten Wartezeit von Minuten betrifft, so liegt die irrsinnige Erklärung in der Erinnerungslosigkeit des Poisson-Prozesses, der die Zeitspanne seit dem Verlassen des letzten Busses, den wir verpasst haben, verkürzt Station bis zu dem Zeitpunkt, an dem wir auftauchen, ist irrelevant, und die erwartete Zeit bis zur Ankunft des nächsten Busses beträgt hartnäckigerweise weiterhin Minuten. Dies ist am besten in diskreter Zeit (geometrische Verteilung) mit dem Würfelbeispiel in Glen_bs Antwort zu sehen.15′ θ=15
In der Tat, wenn wir wissen könnten, wie lange es her ist, dass der vorausfahrende Bus abfährt, wäre die Minuten! Wie in diesem MIT-Video von John Tsitsiklis erklärt , müssten wir uns nur ansehen, was dem Ankunftspunkt als Poisson-Prozess zeitlich rückwärts vorausgeht :E[time waiting (future) + time to last bus departure (past)]=30
Noch unklar? - Probieren Sie es mit Legos .
quelle
Es gibt eine einfache Erklärung, die die unterschiedlichen Antworten auf die Berechnung der erwarteten Wartezeit für Busse, die nach einem Poisson-Prozess ankommen, mit einer vorgegebenen mittleren Interarrival-Zeit (in diesem Fall 15 Minuten) auflöst .
Methode 1 ) Da der Poisson-Prozess (exponentiell) memorylos ist, beträgt die erwartete Wartezeit 15 Minuten.
Methode 2 ) Es ist gleichermaßen wahrscheinlich, dass Sie während der Interarrival-Periode, in der Sie ankommen, zu jeder Zeit ankommen. Daher beträgt die erwartete Wartezeit die Hälfte der erwarteten Länge dieser Interarrival-Periode. DIES IST RICHTIG und widerspricht nicht der Methode (1).
Wie können (1) und (2) richtig sein? Die Antwort ist, dass die erwartete Dauer der Interarrival-Zeit für die Zeit, zu der Sie ankommen, nicht 15 Minuten beträgt. Es sind tatsächlich 30 Minuten; und 1/2 von 30 Minuten ist 15 Minuten, also stimmen (1) und (2) überein.
Warum beträgt die Interarrival-Zeit für die Zeit, zu der Sie ankommen, nicht 15 Minuten? Dies liegt daran, dass die Interarrival-Periode, in der sich die Ankunftszeit befindet, überdurchschnittlich wahrscheinlich eine lange Interarrival-Periode ist. Im Fall einer exponentiellen Interarrival-Zeit arbeitet die Mathematik so, dass die Interarrival-Zeit, in der Sie ankommen, eine Exponential-Zeit ist, die doppelt so lang ist wie die mittlere Interarrival-Zeit für den Poisson-Prozess.
Es ist nicht offensichtlich, dass die genaue Verteilung für die Interarrival-Zeit, die die Zeit enthält, zu der Sie ankommen, ein Exponential mit einem doppelten Mittelwert wäre, aber es ist nach der Erklärung offensichtlich, warum es erhöht wird. Nehmen wir als leicht verständliches Beispiel an, dass die Interarrival-Zeiten 10 Minuten mit einer Wahrscheinlichkeit von 1/2 oder 20 Minuten mit einer Wahrscheinlichkeit von 1/2 betragen. In diesem Fall sind 20 Minuten lange Interarrival-Perioden genauso wahrscheinlich wie 10 Minuten lange Interarrival-Perioden, aber wenn sie auftreten, dauern sie doppelt so lange. Also werden 2/3 der Zeitpunkte während des Tages zu Zeiten sein, zu denen die Interarrival-Zeitspanne 20 Minuten beträgt. Anders ausgedrückt: Wenn wir zuerst eine Zeit auswählen und dann wissen möchten, wie hoch die Interarrival-Zeit ist, die diese Zeit enthält, dann (ohne Berücksichtigung der vorübergehenden Auswirkungen zu Beginn des "Tages"). ) Die voraussichtliche Dauer dieser Interarrival-Zeit beträgt 16 1/3. Wenn wir jedoch zuerst die Interarrival-Zeit auswählen und wissen möchten, wie lang sie voraussichtlich sein wird, sind es 15 Minuten.
Es gibt andere Varianten des Erneuerungsparadoxons, der längenbezogenen Abtastung usw., die sich auf fast dasselbe belaufen.
Beispiel 1) Sie haben eine Reihe von Glühbirnen mit zufälliger Lebensdauer, aber einem Durchschnitt von 1000 Stunden. Wenn eine Glühbirne ausfällt, wird sie sofort durch eine andere Glühbirne ersetzt. Wenn Sie eine Zeit auswählen, um in einen Raum mit einer Glühbirne zu gehen, hat die in Betrieb befindliche Glühbirne eine längere mittlere Lebensdauer als 1000 Stunden.
Beispiel 2) Wenn wir zu einem bestimmten Zeitpunkt auf eine Baustelle gehen, ist die mittlere Zeit, bis ein Bauarbeiter, der zu diesem Zeitpunkt dort arbeitet, vom Gebäude abfällt (von dem Zeitpunkt an, an dem er seine Arbeit aufgenommen hat), größer als die mittlere Zeit bis zum Bauarbeiter fällt von allen Arbeitnehmern ab, die anfangen zu arbeiten. Warum, weil die Arbeitnehmer mit einer kurzen mittleren Zeit bis zum Herabfallen mit überdurchschnittlicher Wahrscheinlichkeit bereits herabgefallen sind (und nicht weiter gearbeitet haben), so dass die Arbeitnehmer, die dann arbeiten, überdurchschnittlich lange Zeit bis zum Herabfallen haben.
Beispiel 3) Wählen Sie eine bescheidene Anzahl zufälliger Personen in einer Stadt aus. Wenn Sie die Heimspiele (nicht alle ausverkauft) der Major League Baseballmannschaft der Stadt besucht haben, finden Sie heraus, wie viele Personen an den Spielen teilgenommen haben, an denen Sie teilgenommen haben. Dann wird (unter einigen leicht idealisierten, aber nicht zu vernünftigen Annahmen) die durchschnittliche Teilnahme für diese Spiele höher sein als die durchschnittliche Teilnahme für alle Heimspiele der Mannschaft. Warum? Da es mehr Leute gibt, die an Spielen mit hoher Anwesenheit als an Spielen mit geringer Anwesenheit teilgenommen haben, ist es wahrscheinlicher, dass Sie Leute auswählen, die an Spielen mit hoher Anwesenheit teilgenommen haben als an Spielen mit geringer Anwesenheit.
quelle
Die gestellte Frage lautete: "... alle 15 Minuten kommt ein Bus an der Bushaltestelle an, und ein Fahrgast kommt zufällig an." Wenn der Bus alle 15 Minuten ankommt, ist das kein Zufall. Es kommt alle 15 Minuten an, die richtige Antwort ist also 7,5 Minuten. Entweder wurde die Quelle falsch zitiert oder der Verfasser der Quelle war schlampig.
Andererseits klingt der Strahlungsdetektor nach einem anderen Problem, da Strahlungsereignisse nach einer gewissen Verteilung zufällig eintreffen, vermutlich so etwas wie Poisson mit einer durchschnittlichen Wartezeit.
quelle