Der Artikel The Odds, Continuually Updated erwähnt die Geschichte eines Fischers auf Long Island, der buchstäblich Bayesian Statistics sein Leben verdankt. Hier ist die kurze Version:
Mitten in der Nacht sitzen zwei Fischer auf einem Boot. Während einer schläft, fällt der andere in den Ozean. Das Boot fährt die ganze Nacht mit dem Autopiloten weiter, bis der erste Mann endlich aufwacht und die Küstenwache benachrichtigt. Die Küstenwache verwendet eine Software namens SAROPS (Search and Rescue Optimal Planning System) , um ihn rechtzeitig zu finden, da er unterkühlt war und fast keine Energie mehr hatte, um über Wasser zu bleiben.
Hier ist die lange Version: Ein Fleck im Meer
Ich wollte mehr darüber wissen, wie der Satz von Bayes hier tatsächlich angewendet wird. Ich habe einiges über die SAROPS-Software herausgefunden, indem ich einfach gegoogelt habe.
Der SAROPS-Simulator
Die Simulatorkomponente berücksichtigt aktuelle Daten wie Meeresströmung, Wind usw. und simuliert Tausende von möglichen Driftpfaden. Aus diesen Driftpfaden wird eine Wahrscheinlichkeitsverteilungskarte erstellt.
Beachten Sie, dass sich die folgenden Grafiken nicht auf den Fall des vermissten Fischers beziehen, den ich oben erwähnt habe, sondern ein Spielzeugbeispiel aus dieser Präsentation sind
Wahrscheinlichkeitskarte 1 (Rot zeigt die höchste Wahrscheinlichkeit an; Blau die niedrigste)
Beachten Sie den Kreis, der der Startpunkt ist.
Wahrscheinlichkeitskarte 2 - Es ist mehr Zeit vergangen
Beachten Sie, dass die Wahrscheinlichkeitskarte multimodal geworden ist. Dies liegt daran, dass in diesem Beispiel mehrere Szenarien berücksichtigt werden:
- Die Person schwimmt im Wasser - Top-Middle-Modus
- Die Person befindet sich in einem Rettungsfloß (stärker vom Wind aus dem Norden betroffen) - unterste 2 Modi (aufgeteilt aufgrund von "Halseneffekten")
Wahrscheinlichkeitskarte 3 - Die Suche wurde entlang der rechteckigen Pfade in Rot durchgeführt. Dieses Bild zeigt die vom Planer erstellten optimalen Pfade (eine weitere Komponente von SAROPS). Wie Sie sehen, wurden diese Pfade durchsucht und die Wahrscheinlichkeitskarte wurde vom Simulator aktualisiert.
Sie wundern sich vielleicht, warum die Bereiche, die durchsucht wurden, nicht auf eine Wahrscheinlichkeit von Null reduziert wurden. Dies liegt daran, dass die Wahrscheinlichkeit eines Ausfalls ( berücksichtigt wird, dh, dass die Wahrscheinlichkeit nicht vernachlässigbar ist, dass der Suchende die Person im Wasser übersieht. Verständlicherweise ist die Ausfallwahrscheinlichkeit für eine alleinstehende Person über Wasser viel höher als für eine Person in einem Rettungsfloß (leichter zu erkennen), weshalb die Wahrscheinlichkeiten im oberen Bereich nicht sehr stark gesunken sind.
Auswirkungen einer erfolglosen Suche
Hier kommt der Satz von Bayes ins Spiel. Sobald eine Suche durchgeführt wurde, wird die Wahrscheinlichkeitskarte entsprechend aktualisiert, sodass eine weitere Suche optimal geplant werden kann.
Nach dem Lesen von Bayes 'Theorem auf Wikipedia und im Artikel Eine intuitive (und kurze) Erklärung von Bayes' Theorem auf BetterExplained.com
Ich habe die Bayes-Gleichung genommen:
Und definiert A und X wie folgt ...
Ereignis A: Die Person befindet sich in diesem Bereich (Gitterzelle)
Test X: Fehlgeschlagene Suche über diesen Bereich (Gitterzelle), dh Sie haben diesen Bereich durchsucht und nichts gesehen
Nachgeben,
Ich habe in Search and Rescue Optimal Planning System festgestellt, dass SAROPS die Wahrscheinlichkeit einer fehlgeschlagenen Suche berechnet , indem es die Suchpfade und simulierten Driftpfade berücksichtigt. Nehmen wir der Einfachheit halber an, wir kennen den Wert von .
Jetzt haben wir
Wird die Bayes-Gleichung hier richtig angewendet?
Wie würde der Nenner, die Wahrscheinlichkeit einer erfolglosen Suche, berechnet werden?
Auch im Such- und Rettungsoptimalen Planungssystem heißt es
Die vorherigen Wahrscheinlichkeiten werden "auf die übliche Bayes'sche Weise normalisiert" , um die hinteren Wahrscheinlichkeiten zu erzeugen
Was bedeutet "normalisiert nach Bayes" ?
Bedeutet dies, dass alle Wahrscheinlichkeiten durch oder einfach normalisiert werden, um sicherzustellen, dass die gesamte Wahrscheinlichkeitskarte eins ergibt? Oder sind diese ein und dasselbe?
Was wäre der richtige Weg, um die Rasterwahrscheinlichkeitskarte nach der Aktualisierung auf eine erfolglose Suche zu normalisieren, wenn Sie bedenken, dass Sie nicht ALLE Bereiche (Gitterzellen) durchsucht haben und einige Zellen gleich und einige gleich ?
Noch ein Hinweis zur Vereinfachung: Gemäß Search and Rescue Optimal Planning System wird die posteriore Verteilung tatsächlich berechnet, indem die Wahrscheinlichkeiten der simulierten Driftpfade aktualisiert und dann die gerasterte Wahrscheinlichkeitskarte neu generiert werden. Um dieses Beispiel einfach zu halten, habe ich die Sim-Pfade ignoriert und mich auf die Gitterzellen konzentriert.
Ich wurde auf ein Buch verwiesen, das ein ganzes Kapitel meiner Frage gewidmet hat - Naval Operations Analysis - von einem ehemaligen Professor, der Hubschrauberpilot war und tatsächlich Such- und Rettungsmissionen durchgeführt hat, nicht weniger!
In Kapitel 8 finden Sie ein Beispiel wie dieses (ich habe es ein wenig angepasst):
Zu Beginn wird die Position der vermissten Person (en), des Bootes usw. im Voraus in Tabellenform angegeben.
Vorabverteilung:
Eine Suche wird auf einem Teil des Gitters durchgeführt und die Wahrscheinlichkeiten werden mit einer normalisierten posterioren Verteilung aktualisiert, indem die Bayes-Gleichung auf die gleiche Weise angewendet wird, wie ich es in meinen Fragen erwähnt habe:
wo (i, j) = (lat, long)
In diesem Fall habe ich mich für die Suche in Spalte 3 entschieden, da diese Spalte die größte vorherige Wahrscheinlichkeit hatte.
Normalisierte posteriore Verteilung nach Durchsuchung der dritten Spalte mit pFail = 0.2:
Meine Frage war hauptsächlich, wie der hintere Teil normalisiert wurde. Hier ist , wie es in dem Buch fertig war - einfach jede einzelne posteriore Wahrscheinlichkeit dividieren durch die Gesamtsumme , S :
Ich habe eine Wahrscheinlichkeit von 0,2 für eine fehlgeschlagene Suche gewählt, weil mein Professor folgendes sagte: "Wir suchen nur mit einer Erkennungswahrscheinlichkeit von 80%, da dies in der Regel der beste Kompromiss zwischen Aktualität und Genauigkeit ist."
Nur zum Spaß habe ich ein weiteres Beispiel mit einem pFail von 0,5 ausgeführt. Während im ersten Beispiel ( pFail = 0,2) die nächstbeste Suchroute (bei normalisierter posteriorer und unter der Annahme von geraden Suchen, keine Diagonale oder Zick-Zack) im zweiten Beispiel ( pFail = 2) wäre, über Spalte 2 zu fliegen 0.5) Die nächstbeste Route verläuft über Zeile 2.
Normalisierte posteriore Verteilung nach Durchsuchung der dritten Spalte mit pFail = 0,5:
Er fügte hinzu: "Flugzeuge haben eine kleine Checkliste dabei, um die beste Flughöhe und Fluggeschwindigkeit zu bestimmen. Das Arbeiten in einem fliegenden Hubschrauber ist, als würde man auf einer Waschmaschine sitzen und ein Buch lesen, das mit Klebeband an einer anderen Waschmaschine befestigt ist."
quelle