114

Dies entstand ursprünglich im Zusammenhang mit einigen Arbeiten, die wir an einem Modell zur Klassifizierung von natürlichem Text durchführen, aber ich habe es vereinfacht ... Vielleicht zu viel.

Sie haben ein blaues Auto (nach objektiven wissenschaftlichen Maßstäben - es ist blau).

Sie zeigen es 1000 Menschen.

900 sagen, es ist blau. 100 nicht.

Sie geben diese Informationen an jemanden weiter, der das Auto nicht sehen kann. Sie wissen nur, dass 900 Leute sagten, es sei blau, und 100 sagten es nicht. Sie wissen nichts mehr über diese Leute (die 1000).

Darauf basierend fragen Sie die Person: "Wie groß ist die Wahrscheinlichkeit, dass das Auto blau ist?"

Dies hat zu großen Meinungsverschiedenheiten zwischen denjenigen geführt, die ich gefragt habe! Was ist die richtige Antwort, wenn es eine gibt?

probability Pat Molloy
quelle

162

Ich frage mich, was die Antworten wären, wenn Sie das Auto wechseln würden , um sich anzuziehen .

user1717828

13

Was ist die Frage an die Menschen? "Ist das Auto blau?" oder "Welche Farbe hat das Auto?"

kon psych

13

Was bedeutet es für das Auto, blau zu sein? Wenn einige Leute sagen, dass das Auto nicht blau ist, dann ist es wahrscheinlich, dass es eine Farbe ist, die einige Leute blau nennen und andere einen anderen Namen nennen. Dies bedeutet nicht, dass sie hinsichtlich der Farbe anderer Meinung sind. Dies bedeutet, dass sie hinsichtlich des Namens der Farbe anderer Meinung sind.

Ben

7

Ich denke, die Frage würde sich erheblich verbessern, wenn Sie die unterschiedlichen Meinungen äußern würden, auf die Sie gestoßen sind. In der jetzigen Situation können Antworten nur das gesamte Gebiet erforschen, von der Wahrscheinlichkeitstheorie über die Farbtheorie bis hin zur Biologie (Farbenblindheit), und ich verstehe nicht, wie das Ihnen wirklich helfen würde.

AnoE

32

In der Problembeschreibung fehlt etwas. 100 Leute, die bestreiten, dass das Auto blau ist, wenn es sicher blau ist, sind viele Leute. Man kann sie nicht einfach als zufällige Fehler verwerfen.

Aksakal

117

TL; DR: Sofern Sie nicht davon ausgehen, dass die Beurteilung der Autofarbe durch die Menschen unangemessen schlecht ist oder dass blaue Autos unangemessen selten sind, bedeutet die große Anzahl der Personen in Ihrem Beispiel, dass die Wahrscheinlichkeit, dass das Auto blau ist, im Grunde 100% beträgt.

Matthew Drury hat bereits die richtige Antwort gegeben, aber ich möchte sie nur mit einigen numerischen Beispielen ergänzen, da Sie Ihre Zahlen so gewählt haben, dass Sie tatsächlich ziemlich ähnliche Antworten für eine Vielzahl verschiedener Parametereinstellungen erhalten. Nehmen wir zum Beispiel an, wie Sie in einem Ihrer Kommentare gesagt haben, dass die Wahrscheinlichkeit, dass Menschen die Farbe eines Autos richtig beurteilen, 0,9 beträgt. Das heißt: und auch

p (Sag, es ist blau | Auto ist blau) = 0.9 = 1 - p (Sag, es ist nicht blau | Auto ist blau)

$p(\text{say it's blue}|\text{car is blue})=0.9=1-p(\text{say it isn't blue}|\text{car is blue})$

p (Sag, es ist nicht blau | Auto ist nicht blau) = 0.9 = 1 - p (sag es ist blau | Auto ist nicht blau)

$p(\text{say it isn't blue}|\text{car isn't blue})=0.9=1-p(\text{say it is blue}|\text{car isn't blue})$

Nachdem wir das definiert haben, müssen wir uns entscheiden: Wie hoch ist die Wahrscheinlichkeit, dass das Auto blau ist? Wählen wir eine sehr geringe Wahrscheinlichkeit, um zu sehen, was passiert, und sagen wir , dh nur 0,1% aller Autos sind blau. Dann kann die hintere Wahrscheinlichkeit, dass das Auto blau ist, wie folgt berechnet werden: $p(\text{car is blue})=0.001$

\begin{aligned} p (Auto ist blau | Antworten) \\ = \frac{p (Antworten | Auto ist blau) p (Auto ist blau)}{p (Antworten | Auto ist blau) p (Auto ist blau) + p (Antworten | Auto ist nicht blau) p (Auto ist nicht blau)} \\ = \frac{{0.9}^{900} \times {0,1}^{100} \times 0,001}{{0.9}^{900} \times {0,1}^{100} \times 0,001 + {0,1}^{900} \times {0.9}^{100} \times 0,999} \end{aligned}

$\begin{align*} &p(\text{car is blue}|\text{answers})\\ &=\frac{p(\text{answers}|\text{car is blue})\,p(\text{car is blue})}{p(\text{answers}|\text{car is blue})\,p(\text{car is blue})+p(\text{answers}|\text{car isn't blue})\,p(\text{car isn't blue})}\\ &=\frac{0.9^{900}\times 0.1^{100}\times0.001}{0.9^{900}\times 0.1^{100}\times0.001+0.1^{900}\times0.9^{100}\times0.999} \end{align*}$

Wenn Sie sich den Nenner ansehen, ist es ziemlich klar, dass der zweite Term in dieser Summe vernachlässigbar ist, da die relative Größe der Terme in der Summe durch das Verhältnis von zu dominiert wird , was in der Größenordnung von . Wenn Sie diese Berechnung auf einem Computer durchführen (um numerische Unterlaufprobleme zu vermeiden), erhalten Sie eine Antwort von 1 (innerhalb der Maschinengenauigkeit). $0.9^{900}$ $0.1^{900}$ $10^{58}$

Der Grund, warum die vorherigen Wahrscheinlichkeiten hier nicht wirklich wichtig sind, ist, dass Sie so viele Beweise für eine Möglichkeit (das Auto ist blau) im Vergleich zu einer anderen haben. Dies kann durch das Wahrscheinlichkeitsverhältnis quantifiziert werden , das wir wie berechnen können:

\frac{p (Antworten | Auto ist blau)}{p (Antworten | Auto ist nicht blau)} = \frac{{0.9}^{900} \times {0,1}^{100}}{{0,1}^{900} \times {0.9}^{100}} \approx 10^{763}

$\frac{p(\text{answers}|\text{car is blue})}{p(\text{answers}|\text{car isn't blue})}=\frac{0.9^{900}\times 0.1^{100}}{0.1^{900}\times 0.9^{100}}\approx 10^{763}$

Bevor wir also die vorherigen Wahrscheinlichkeiten in Betracht ziehen, deuten die Beweise darauf hin, dass eine Option bereits astronomisch wahrscheinlicher ist als die andere, und um einen Unterschied zu machen, müssten blaue Autos unvernünftig, dumm und selten sein (so selten, wie wir es erwarten würden) finde 0 blaue Autos auf der Erde).

Was ist also, wenn wir ändern, wie genau die Menschen in ihren Beschreibungen der Autofarbe sind? Natürlich könnten wir das bis zum Äußersten treiben und sagen, dass sie es nur zu 50% richtig machen, was nicht besser ist, als eine Münze zu werfen. In diesem Fall ist die hintere Wahrscheinlichkeit, dass das Auto blau ist, einfach gleich der vorherigen Wahrscheinlichkeit, da die Antworten der Leute uns nichts sagten. Aber die Leute machen es sicherlich ein bisschen besser, und selbst wenn wir sagen, dass die Leute nur 51% der Zeit genau sind, ist die Wahrscheinlichkeitsquote immer noch so hoch, dass das Auto ungefähr mal so wahrscheinlich ist, dass es blau ist . $10^{13}$

Dies ist alles ein Ergebnis der ziemlich großen Zahlen, die Sie in Ihrem Beispiel gewählt haben. Wenn 9/10 Leute gesagt hätten, das Auto sei blau, wäre es eine ganz andere Geschichte gewesen, obwohl sich das gleiche Verhältnis von Leuten in einem Lager im Vergleich zum anderen befand. Denn statistische Belege hängen nicht von diesem Verhältnis ab, sondern vom numerischen Unterschied zwischen den gegnerischen Fraktionen. Tatsächlich stornieren die 100 Leute, die sagen, dass das Auto nicht blau ist, im Wahrscheinlichkeitsverhältnis (das die Beweise quantifiziert) genau 100 der 900 Leute, die sagen, dass es blau ist, also ist es dasselbe, als hätten Sie 800 Leute, die alle zustimmen es war blau. Und das ist offensichtlich ein ziemlich klarer Beweis.

(Bearbeiten: Wie Silverfish betonte, implizierten die Annahmen, die ich hier gemacht habe, tatsächlich, dass eine Person, wenn sie ein nicht blaues Auto falsch beschreibt, standardmäßig sagt, dass es blau ist. Dies ist natürlich nicht realistisch, da sie wirklich jede Farbe sagen könnte Dies macht jedoch keinen Unterschied zu den Schlussfolgerungen, denn je seltener Menschen ein nicht blaues Auto mit einem blauen verwechseln, desto stärker ist der Beweis, dass es blau ist, wenn sie es sagen Wenn überhaupt, sind die oben angegebenen Zahlen eigentlich nur eine Untergrenze des Pro-Blau-Beweises.)

Ruben van Bergen
quelle

11

+1. Tatsächlich beträgt die MLE-Schätzung, wie oft Menschen genau sind, nach den OP-Daten 900/1000 = 90%.

Amöbe

5

In 50% der Fälle ist es nicht dasselbe, eine Autofarbe richtig einzustellen, als eine Münze zu werfen. Immerhin gibt es weit mehr als nur zwei verfügbare Farben. Vielleicht sagen manche auch "Marine" oder "Azurblau" statt "Blau"? Tatsächlich werden viele Leute fälschlicherweise "blau" sagen, wenn die richtige Antwort "eine schicke und modische, patentierte Farbe, die fast wie blau aussieht" wäre

Hagen von Eitzen,

10

Ich weiß, dass dies nur illustrative Zahlen sind, aber wenn "die Wahrscheinlichkeit, dass Menschen die Farbe eines Autos richtig beurteilen, 0,9 beträgt", halte ich es nicht für vernünftig, p (sagen wir es ist blau (Auto ist nicht blau) = 0.1. Wenn wir denken, dass 90% der Zeit Menschen die richtige Farbe identifizieren, dann ist p (sagen wir, dass Rot | Auto Rot ist) = p (sagen wir, dass Weiß | Auto Weiß ist) = p (sagen wir, dass Grün | Auto Grün ist) = 0,9 und so ein für alle möglichen Autofarben. Aber warum sollte p (sagen wir, dass blau | auto rot ist) = p (sagen wir, dass blau | auto weiß ist) = p (sagen wir, dass blau | auto grün ist) = 0.1? Dies würde bedeuten, dass zB p (sagen wir, dass Weiß | Auto rot ist) = 0 ist.

Silberfischchen

2

@ PatMolloy: Nicht unbedingt. Es kommt darauf an, ob die Wahrscheinlichkeiten symmetrisch sind: Ist es gleichermaßen wahrscheinlich, dass jemand ein Blau für ein nicht blaues Auto hält, wie jemand ein Nicht-Blau für ein blaues Auto hält? Wenn ja, dann liefert ein 500/500 Urteil genau so viele Informationen wie ein Münzwurf. Aber wenn die Leute seltener sagen, ein nicht blaues Auto sei blau, als sie sagen, ein blaues Auto sei nicht blau, dann sind die 500 Blausager unter dem Strich schwerer zu erklären als die 500 Nicht-Blausager nicht-blaue Hypothese. In diesem Fall würde die Evidenzbilanz in Richtung Blau tendieren.

Ruben van Bergen

3

Farbwahrnehmung ist eine heikle Sache. Wenn neun von zehn Menschen sagen, dass ein Kleid weiß und gold ist, wie hoch ist die Wahrscheinlichkeit, dass es blau und schwarz ist?

Glen_b

73

Die richtige Antwort hängt von Informationen ab, die im Problem nicht angegeben sind. Sie müssen einige weitere Annahmen treffen, um eine einzige, endgültige Antwort abzuleiten:

Die vorherige Wahrscheinlichkeit, dass das Auto blau ist, d. H. Ihre Annahme, dass das Auto blau ist, haben Sie noch niemanden gefragt.
Die Wahrscheinlichkeit , jemand sagt Ihnen , das Auto blau ist , wenn es tatsächlich ist blau, und die Wahrscheinlichkeit , sie Ihnen sagen , das Auto ist blau , wenn es tatsächlich ist nicht blau.
Die Wahrscheinlichkeit, dass das Auto tatsächlich blau ist, wenn jemand sagt, dass es blau ist, und die Wahrscheinlichkeit, dass das Auto nicht blau ist, wenn jemand sagt, dass es blau ist.

Mit diesen Informationen können wir das Ganze mit der Bayes-Formel aufschlüsseln, um eine spätere Wahrscheinlichkeit für das blaue Auto abzuleiten. Ich werde mich auf den Fall konzentrieren, in dem wir nur eine Person fragen, aber die gleiche Argumentation kann auf den Fall angewendet werden, in dem Sie Personen fragen . $1000$

\begin{aligned} P_{p o s t} (car is blue) & = P (car is blue ∣ say is blue) P (say is blue) \\ + P (car is blue ∣ say is not blue) P (say is not blue) \end{aligned}

$\begin{align*} P_{post} (\text{car is blue}) &= P(\text{car is blue} \mid \text{say is blue}) P(\text{say is blue}) \\ & \ \ \ \ + P(\text{car is blue} \mid \text{say is not blue}) P(\text{say is not blue}) \end{align*}$

Wir müssen weiter zerlegen , hier kommt der Prior ins Spiel: $P(\text{say is blue})$

\begin{aligned} P (say is blue) = & P (say is blue ∣ car is blue) P_{p r i o r} (car is blue) \\ + P (say is blue ∣ car is not blue) P_{p r i o r} (car is not blue) \end{aligned}

$\begin{align*} P(\text{say is blue}) = \ &P(\text{say is blue} \mid \text{car is blue}) P_{prior}(\text{car is blue}) \\ &+ P(\text{say is blue} \mid \text{car is not blue}) P_{prior}(\text{car is not blue}) \end{align*}$

Zwei Anwendungen der Bayes-Regel bringen Sie also ans Ziel. Sie müssen die nicht angegebenen Parameter auf der Grundlage der Informationen, die Sie über die jeweilige Situation haben, oder anhand einiger vernünftiger Annahmen ermitteln.

Es gibt einige andere Kombinationen der Annahmen, die Sie treffen können, basierend auf:

P (say is blue ∣ car is blue) P (car is blue) = P (car is blue ∣ say is blue) P (say is blue)

$P(\text{say is blue} \mid \text{car is blue}) P(\text{car is blue}) = P(\text{car is blue} \mid \text{say is blue}) P(\text{say is blue})$

Zu Beginn wissen Sie nichts davon. Sie müssen also einige vernünftige Annahmen zu drei davon treffen, und dann wird die vierte von dort bestimmt.

Matthew Drury
quelle

5

Das ist oft der Fall. Dann haben Sie zwei Möglichkeiten, Ihre völlige Unkenntnis auszudrücken, indem Sie davon ausgehen, dass Blau und nicht Blau gleich wahrscheinlich sind. Machen Sie einen kurzen Überblick über das Gebiet, etwas wie dieses kann helfen: de.wikipedia.org/wiki/Car_colour_popularity

Matthew Drury

18

@Matthew das Problem mit "blau und nicht blau ist gleich wahrscheinlich" ist, dass es nicht konsistent ist; Wenn wir für jede der möglichen Autofarben die gleiche Überlegung anwenden, erhalten wir die Behauptung, dass alle gleichzeitig eine 50% ige Chance haben (unmöglich mit mehr als zwei Farben nach den Gesetzen der Wahrscheinlichkeit) und eine weniger als 50% ige Chance (bei Ihnen) schau auf blau im "nicht weiß" und "nicht rot", was auch zu widersprüchen führt, da die wahrscheinlichkeit einer farbe nicht mehrere

werte annehmen

2

Es gibt mehr nicht näher spezifizierte Informationen als diese, da die Antwort der Personen nicht unbedingt unabhängig sein muss (wir hoffen, dass sie stark mit der objektiven Farbe korrelieren und somit weit davon entfernt sind, unabhängig zu sein). Was ist, wenn die Antworten "übermäßig" abhängig sind? Sagen wir, wir fragen einfach zehn zufällige Fußgänger, aber haben sie jeweils 100 Antworten?

Hagen von Eitzen

2

P (Joe and Mary say blue | car is blue) = P (Joe says blue | car is blue) \cdot P (Mary says blue | car is blue)

$P(\text {Joe and Mary say blue} | \text {car is blue}) = P(\text {Joe says blue} | \text {car is blue}) \cdot P(\text {Mary says blue} | \text {car is blue})$

15

@ Glen_b: Es gibt nur zwei Farben auf der Welt, blau und nicht blau. Zugegeben, beide sind in verschiedenen Farbtönen erhältlich, besonders nicht in Blau.

Psmears

13

Es gibt eine wichtige Annahme, dass Ihre 1000 Meinungen keine systematische Tendenz teilen. Was hier eine vernünftige Annahme ist, aber in anderen Fällen wichtig sein könnte.

Beispiele könnten sein:

Sie alle haben eine ähnliche Farbenblindheit (z. B. Genetik in einer Population).
Sie alle sahen das Auto nachts unter oranger Natrium-Straßenbeleuchtung.
Sie alle teilen eine gemeinsame Kultur, in der Blau tabuisiert oder magisch assoziiert ist (was darauf hindeutet, ob sie ein Objekt als blau beschreiben oder stattdessen einen kulturellen Euphemismus verwenden oder was auch immer).
Ihnen allen wurde gesagt (oder sie teilen eine gemeinsame Überzeugung), dass ihnen etwas Gutes / Schlechtes passieren wird, wenn sie auf eine bestimmte Weise antworten / nicht antworten.

Dies ist in diesem Fall nicht wahrscheinlich, in anderen Fällen jedoch eine wichtige implizite Annahme. Es muss auch nicht so extrem sein. Übertragen Sie Ihre Frage auf eine andere Domäne, und dies wird ein realer Faktor sein.

Beispiele für jede Frage, bei der Ihre Antwort von einer gemeinsamen Tendenz beeinflusst werden kann:

Fragen Sie, ob ein hohes, dünnes Glas mehr enthält als ein eigentlich identisches, kurzes, dickes Glas, aber Ihre 1000 Befragten sind sehr kleine Kinder (geteilte falsche Wahrnehmung).
Fragen Sie 1000 Personen, ob das Gehen unter einer Leiter gefährlich ist (allgemeiner kultureller Glaube).
Fragen Sie 1000 verheiratete Menschen, ob sie ihren Partner lieben oder ob sie eine Affäre hatten, wenn sie glauben, dass ihr Partner von ihrer Antwort weiß. Der Kontext kann eine TV-Show sein oder ein Partner, der anwesend ist, wenn er gefragt wird usw. (gemeinsame Überzeugung über die Konsequenzen)

Es ist nicht schwer, sich einige strukturell identische Fragen vorzustellen, bei denen die 900: 100-Antwort ein Maß für Glauben und Ehrlichkeit oder etwas anderes war und nicht auf die richtige Antwort hinweist. In diesem Fall nicht wahrscheinlich, aber in anderen Fällen - ja.

Stilez
quelle

11

Ein Grund, warum Sie unterschiedliche Antworten von unterschiedlichen Personen erhalten, ist, dass die Frage auf unterschiedliche Weise interpretiert werden kann und nicht klar ist, was Sie hier mit "Wahrscheinlichkeit" meinen. Eine Möglichkeit, die Frage zu verstehen, besteht darin, Prioritäten und Gründe gemäß der Bayes-Regel wie in Matthews Antwort zuzuweisen.

Bevor Sie nach Wahrscheinlichkeiten fragen, müssen Sie entscheiden, was als zufällig modelliert wird und was nicht. Es ist nicht allgemein anerkannt, dass unbekannte, aber feste Mengen vorrangig vergeben werden sollten. Hier ist ein ähnliches Experiment wie bei Ihnen, das das Problem mit der Frage hervorhebt:

$X_i$ $i = 1, \dots, 1000$ $p = 0.5$ $X_i$ $\sum_{i = 1}^{1000}X_i = 900$

$p$ $p$

ekvall
quelle

1

Wenn Sie also die Annahme entfernen, dass das Auto blau ist und der Rest gleich ist, sagen 900 Personen, dass es blau ist, und 100, dass es nicht so ist. In diesem Fall wäre die Wahrscheinlichkeit 0,9.

Benutzer

Nein, es ist viel näher an 1. Es ist sehr, sehr unwahrscheinlich, dass 900 von 1000 Menschen die falsche Farbe bekommen.

gnasher729

1

the probability is either one or zero, depending on whether the car is actually blue or not.Dies entspricht nicht dem Verständnis von "Wahrscheinlichkeit", wie ich es kenne. Es klingt ein bisschen wie "X kann passieren oder kann nicht passieren, also muss die Wahrscheinlichkeit 50% sein". Können Sie etwas klarer machen, was Sie mit diesem Satz meinen?

AnoE

2

@AnoE Die Unterscheidung ist analog zu der zwischen Parametern und Zufallsvariablen. In der Fragestellung wird angegeben, dass das Auto für eine Tatsache blau ist, seine Farbe ist nicht das Ergebnis eines zufälligen Experiments. Es ist im Wesentlichen eine häufig auftretende v. Bayesianische Interpretation. Wenn Sie eine Münze 1000-mal werfen und 900 Köpfe beobachten, wie hoch ist dann die Wahrscheinlichkeit, dass die Münze fair ist? Es ist entweder eins oder null, wenn Sie häufig (oder unsinnig) sind. Wir weisen Parametern keine Wahrscheinlichkeiten zu.

ekvall

@user Nein, ich habe die Antwort aktualisiert, um meinen Standpunkt klarer zu machen.

ekvall

7

Einfache praktische Antwort:

Die Wahrscheinlichkeit kann leicht zwischen 0% und 100% liegen, abhängig von Ihren Annahmen

Obwohl mir die vorhandenen Antworten wirklich gefallen, läuft es in der Praxis im Wesentlichen auf diese beiden einfachen Szenarien hinaus:

Szenario 1: Es wird angenommen, dass Menschen Blau sehr gut erkennen können, wenn es blau ist ... 0%

In diesem Fall gibt es so viele Leute, die behaupten, dass das Auto nicht blau ist, dass es sehr unwahrscheinlich ist, dass das Auto tatsächlich blau ist. Daher nähert sich die Wahrscheinlichkeit 0%.

Szenario 2: Menschen angenommen werden sehr gut , nicht-blau zu erkennen , wenn es nicht-blau ist ... 100%

In diesem Fall gibt es so viele Leute, die behaupten, dass das Auto blau ist, dass es sehr wahrscheinlich tatsächlich blau ist. Daher nähert sich die Wahrscheinlichkeit 100%.

Wenn Sie dies aus mathematischer Sicht betrachten, würden Sie natürlich mit etwas Allgemeinem wie "Nehmen wir an, die relevanten Wahrscheinlichkeiten sind ..." beginnen, was völlig bedeutungslos ist, da solche Dinge normalerweise für keine zufälligen Umstände bekannt sind. Daher empfehle ich, die Extreme zu betrachten, um die Idee zu erfassen, dass beide Prozentsätze leicht mit einfachen und realistischen Annahmen gerechtfertigt werden können und dass es daher keine einzige aussagekräftige Antwort gibt.

Dennis Jaheruddin
quelle

2

Wenn man annimmt, dass Menschen Blau sehr gut erkennen, warum schätzt man dann, dass es blau ist, wenn es sich nicht in Szenario 1 befindet? Vielleicht möchten Sie Ihre Szenarien in Form von falschen Positiven und falschen Negativen ausdrücken.

Hyde

@hyde Die Szenarien wurden umformuliert, um Mehrdeutigkeiten zu beseitigen

Dennis Jaheruddin

Falsch positives Paradoxon

Barmar

5

Sie müssen einen Schätzungsrahmen entwickeln. Einige Fragen, die Sie möglicherweise stellen, sind

Wie viele Farben gibt es? Sprechen wir zwei Farben? Oder alle Farben des Regenbogens?
Wie deutlich sind die Farben? Reden wir blau und orange? Oder Blau, Cyan und Türkis?
Was bedeutet es, blau zu sein? Sind Cyan und / oder Türkis blau? Oder nur blau selbst?
Wie gut können diese Leute Farben einschätzen? Sind sie alle Grafikdesigner? Oder sind sie farbenblind?

Von einem rein statistischen Standpunkt aus können wir einige Vermutungen über den letzten anstellen. Erstens wissen wir, dass mindestens 10% der Menschen eine falsche Antwort wählen. Wenn es nur zwei Farben gibt (ab der ersten Frage), könnte man sagen, dass es welche gibt

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

Zur schnellen Überprüfung, wenn wir diese addieren, erhalten wir 100%. Eine mathematischere Darstellung finden Sie in der Antwort von @MatthewDrury .

Wie bekommen wir die 90% im dritten? Es ist, wie viele Leute Blau sagten, aber falsch lagen, wenn es nicht so ist. Da es nur zwei Farben gibt, sind diese symmetrisch. Wenn es mehr als zwei Farben gäbe, wäre die Wahrscheinlichkeit, dass die falsche Wahl für Blau getroffen wird, wenn etwas anderes gesagt wird, geringer.

Auf jeden Fall ergibt diese Schätzmethode 90% Blau. Dies beinhaltet eine 81% ige Chance, dass Leute Blau sagen, wenn es ist, und eine 9% ige Chance, dass Leute sagen, dass es nicht ist, wenn es ist. Dies ist wahrscheinlich der nächste Punkt, an dem wir die ursprüngliche Frage beantworten können, und es erfordert, dass wir uns auf die Daten stützen, um zwei verschiedene Dinge abzuschätzen. Und anzunehmen, dass die Chance, dass Blau gewählt wird, die gleiche ist, wie die Chance, dass Blau richtig ist.

Wenn es mehr als zwei Farben gibt, wird sich die Logik etwas ändern. Die ersten beiden Zeilen bleiben gleich, aber wir verlieren die Symmetrie in den letzten beiden Zeilen. In diesem Fall brauchen wir mehr Input. Möglicherweise schätzen wir die Wahrscheinlichkeit, dass Blau wieder richtig gesagt wird, auf 81%, aber wir haben keine Ahnung, wie hoch die Wahrscheinlichkeit ist, dass die Farbe blau ist, wenn jemand sagt, dass dies nicht der Fall ist.

Wir könnten auch die Zweifarbenschätzung verbessern. Bei einer statistisch signifikanten Anzahl von Autos jeder Farbe könnte eine statistisch signifikante Anzahl von Personen diese anzeigen und kategorisieren. Dann könnten wir zählen, wie oft die Menschen Recht haben, wenn sie eine Farbauswahl treffen, und wie oft sie für jede Farbauswahl Recht haben. Dann könnten wir die tatsächlichen Entscheidungen der Menschen genauer abschätzen.

Sie könnten fragen, wie 90% falsch sein könnten. Überlegen Sie, was passiert, wenn drei Farben vorhanden sind: Azurblau, Blau und Saphir. Jemand könnte vernünftigerweise davon ausgehen, dass alle drei blau sind. Aber wir wollen mehr. Wir wollen den genauen Farbton. Aber wer erinnert sich an die Namen der anderen Farben? Viele mögen Blau erraten, weil es der einzige passende Farbton ist, den sie kennen. Und immer noch falsch, wenn es sich als azurblau herausstellt.

Brythan
quelle

Wie in einem der vorhergehenden Kommentare erwähnt, sind die beiden einzigen relevanten Farben "blau" und "nicht blau", daher sollte der Teil über mehrere Farben nicht benötigt werden.

Dennis Jaheruddin

4

Eine genaue, mathematische, wahr / falsch-Wahrscheinlichkeit kann mit den von Ihnen angegebenen Informationen nicht berechnet werden .

Im wirklichen Leben sind solche Informationen jedoch niemals mit Sicherheit verfügbar. Aus unserer Intuition (und wo mein ganzes Geld hingeht, wenn wir wetten) ist das Auto definitiv blau. (Einige glauben, dass dies keine Statistik mehr ist, aber Schwarz-Weiß-Ansichten der Wissenschaft sind nicht sehr hilfreich.)

Die Argumentation ist einfach. Angenommen, das Auto ist nicht blau. Dann haben sich 90% der Leute (!) Geirrt. Sie können nur aufgrund einer Liste von Problemen falsch sein, einschließlich:

Farbenblindheit
pathologische Lüge
unter dem Einfluss von Substanzen wie Alkohol, LCD usw
Die Frage nicht verstehen
andere Form der psychischen Störung
eine Kombination der oben genannten

Da die oben genannten Faktoren 90% einer durchschnittlichen Zufallsbevölkerung eindeutig nicht betreffen (z. B. sind etwa 8% der Männer und 0,6% der Frauen von Farbenblindheit betroffen, d. H. 43 von 1000 Personen), ist es zwangsläufig so, dass es sich um ein Auto handelt Blau. (Das ist, wenn mein ganzes Geld sowieso gehen würde).

Luchonacho
quelle

Das scheint mir intuitiv richtig zu sein. Ich denke, die Kritik an der ursprünglichen Frage ist, dass nicht genügend Informationen zur Verfügung stehen und dass bestimmte Annahmen getroffen werden müssen. Nun, ist das in der realen Welt nicht fast immer der Fall ???

Pat Molloy

@PatMolloy Es gibt nicht genügend Informationen, um eine genaue richtige / falsche hochentwickelte mathematische Antwort zu liefern (was sicherlich das Ziel vieler Fragen auf dieser Website ist). Angesichts der reduzierten Informationen, die Sie gaben, ist dies jedoch die Antwort (100%), die die Leute wählen werden, wenn es um das Wetten von Geld geht.

luchonacho

1

Ich denke, Sie haben es versäumt, einige der plausibelsten Alternativen aufzuzeigen - die Sie veranlassen sollten, Ihre Schlussfolgerung zu ändern. Dazu gehören (a) Menschen, die Blau nicht erkennen können; (b) es gibt kein gemeinsames Verständnis von "blau" zwischen dem Fragesteller und den Befragten; (c) die "wissenschaftliche" Bedeutung von "blau" unterscheidet sich von dem, was die Leute üblicherweise als "blau" verstehen. Da Sie keine dieser Alternativen oder die meisten von Ihnen aufgeführten Alternativen quantifizieren können , wie können Sie möglicherweise die Quantifizierung der Wahrscheinlichkeit der Antwort rechtfertigen? Das ist keine Statistik!

whuber

"Da die Wahrscheinlichkeit, dass 90% einer durchschnittlichen Zufallsbevölkerung davon betroffen sind, eindeutig gering ist". Seien Sie sich da nicht so sicher. Denken Sie daran, dass wir im Allgemeinen über Durchschnittswerte sprechen, wenn wir über Menschen sprechen. Sicher, nur wenige Prozent haben Farbenblindheit (im Vergleich zum Durchschnitt), aber es gibt möglicherweise einige, die überlegene Sicht haben, z. B. Tetrachromaten.

NPSF3000

2

Ich bin immer unter dem Einfluss von LCD

Alex

2

Ich würde keinen Kot essen, der auf der Tatsache basiert, dass Milliarden von Fliegen nicht falsch sein können. Es könnte Dutzende anderer Gründe geben, warum 900 von 1000 Menschen betrogen wurden, um zu glauben, das Auto sei blau. Immerhin ist dies die Basis für magische Tricks, die Menschen dazu verleiten, an etwas zu denken, das von der Realität entfernt ist. Wenn 900 von 1000 Menschen einen Zauberer sehen, der seine / ihre Assistentin ersticht, werden sie umgehend antworten, dass die Assistentin erstochen wurde, weil es unwahrscheinlich ist, dass auf der Bühne ein Mord geschehen ist. Ein blaues Licht auf einem reflektierenden Autolack?

user174494
quelle

2

Der Befragte weiß zu wenig darüber, wie die Umfrage durchgeführt wurde, um die Frage richtig zu beantworten. Für ihn kann die Umfrage unter mehreren Problemen leiden:

Die Leute, die an der Umfrage teilgenommen haben, hätten voreingenommen sein können:

Das Auto sah wegen einer optischen Täuschung blau aus .
Die Farbe des Autos war aus irgendeinem Grund schwer zu beobachten, und den Leuten waren aus irgendeinem Grund viele blaue Autos vor diesem gezeigt worden, was die meisten davon überzeugte, dass dieses Auto wahrscheinlich auch blau war.
Sie hatten sie bezahlt, um zu sagen, dass das Auto blau ist.
Sie haben alle hypnotisieren lassen, dass das Auto blau ist.
Sie hatten einen Pakt geschlossen, um zu lügen und die Umfrage zu sabotieren.

Möglicherweise gab es Korrelationen zwischen den Personen, die an der Umfrage teilgenommen haben, weil sie ausgewählt wurden oder weil sie sich gegenseitig beeinflusst haben:

Sie haben die Umfrage versehentlich bei einem Massentreffen für Menschen mit der gleichen Farbenblindheit durchgeführt.
Sie haben die Umfrage in Kindergärten durchgeführt; Die Mädchen interessierten sich nicht für das Auto und die meisten Jungen hatten Blau als ihre Lieblingsfarbe, was sie sich vorstellen ließ, dass das Auto blau war.
Die erste Person, der das Auto gezeigt wurde, war betrunken und hielt es für blau. Sie rief "ES IST BLAU" und ließ alle anderen glauben, das Auto sei blau.

Während die Wahrscheinlichkeit, dass das Auto blau ist, wenn die Umfrage vollständig korrekt durchgeführt wurde, extrem hoch ist (wie in Ruben van Bergens Antwort erläutert), kann die Zuverlässigkeit der Umfrage beeinträchtigt worden sein, wodurch die Möglichkeit besteht, dass das Auto nicht blau ist unbedeutend. Wie groß der Befragte diese Chance letztendlich einschätzt, hängt von seiner Einschätzung ab, wie wahrscheinlich es ist, dass die Umstände mit der Umfrage in Konflikt geraten sind und wie gut Sie Umfragen durchführen können (und wie boshaft er denkt, dass Sie sind).

Hallo Auf Wiedersehen
quelle

2

Was ist die Definition von "blau"?

Unterschiedliche Kulturen und Sprachen haben unterschiedliche Vorstellungen von Blau. IIRC, einige Kulturen schließen Grün in ihre Vorstellung von Blau ein!

Wie bei jedem Wort in natürlicher Sprache kann man nur davon ausgehen, dass es eine kulturelle Konvention darüber gibt, wann (und wann nicht) man Dinge "blau" nennt.

Insgesamt ist die Farbe in der Sprache überraschend subjektiv (Link aus den Kommentaren unten, danke @Count Ibilis)

Anony-Mousse
quelle

7

Im Zusammenhang mit der Frage halte ich diesen speziellen Aspekt für ziemlich irrelevant - ich gehe davon aus, dass das OP das Wort "blau" als einen sehr allgemeinen Begriff gewählt hat und nicht so etwas wie "azurblau", "torqouise" usw., bei dem die Leute sich nicht sicher sind. Autos neigen normalerweise dazu, eine sehr begrenzte Palette möglicher / üblicher Farben zu verwenden. Schließlich lautet die Frage nicht "Warum haben 100 Menschen nicht blau gesagt", sondern "Mit welcher Wahrscheinlichkeit ist das Auto tatsächlich blau?".

AnoE

2

vimeo.com/120808489

Graf Iblis

Eine genaue Definition wäre "strahlt Licht vorwiegend mit einer Wellenlänge von 475 nm plus minus 10-20 nm unter den gegenwärtigen Umgebungsbedingungen aus". Dies wird allgemein als blau akzeptiert.

Rackandboneman

Ja, aber wie viele Personen tragen ein Werkzeug mit sich, um die vorherrschende Wellenlänge zu messen? Sie haben auch vergessen, nicht sichtbare Wellenlängen auszuschließen.

Anony-Mousse

1

Die Frage scheint über die Verwendung einer Gruppe von Personen mit unbekannter Kalibrierung statistisch als Wellenlängenmesser zu sein :)

Rackandboneman

1

Die Wahrscheinlichkeit könnte, abhängig von genaueren Voraussetzungen, mehrere unterschiedliche Werte sein, aber 99,995% ist derjenige, der für mich am sinnvollsten ist.

Wir wissen per definitionem, dass das Auto blau ist (das sind 100%), aber es ist nicht genau festgelegt, was dies eigentlich bedeutet (das wäre etwas philosophisch). Ich gehe davon aus, dass etwas in gewissem Sinne blau ist und tatsächlich als blau gesehen werden kann.

Wir wissen auch, dass 90% der Testpersonen es als blau bezeichneten.

Wir wissen nicht , was gefragt wurde oder wie die Bewertung durchgeführt wurde und bei welchen Lichtverhältnissen sich das Auto befand. Bei der Frage nach der Farbe könnten einige Probanden z habe das nicht als "blau" gewertet. Dieselben Leute hätten vielleicht mit "Ja" geantwortet, wenn die Frage "Ist das blau?" Gewesen wäre. Ich gehe davon aus, dass Sie Ihre Probanden nicht in böswilliger Absicht täuschen wollten.

Wir wissen , dass die Inzidenz von tritanopy etwa 0,005%, was bedeutet , dass , wenn das Fahrzeug tatsächlich so blau zu sehen ist , dann 99,995% der Probanden in die Tat sah die Farbe als blau. Dies bedeutet jedoch, dass 9,995% der Testpersonen kein Blau meldeten, wenn sie deutlich Blau sahen. Sie logen über das, was sie sahen. Dies entspricht in etwa dem, was Ihnen Ihre Lebenserfahrung sagt: Die Menschen sind nicht immer ehrlich (aber es sei denn, es gibt ein Motiv, sind sie es normalerweise).

Somit kann die nicht beobachtende Person mit überwältigender Sicherheit annehmen, dass das Auto blau ist. Das wäre 100%

Außer ... außer wenn die nicht beobachtende Person selbst an Tritanopie leidet. In diesem Fall würde sie das Auto nicht als blau sehen, obwohl alle anderen (oder vielmehr 90% von ihnen) dies sagen. Hier wird es wieder philosophisch: Wenn alle anderen einen Baum fallen hörten, aber ich nicht, ist er gefallen?

Ich gehe davon aus, dass die vernünftigste und praktischste Antwort lautet: Wenn die nicht beobachtende Person zufällig Trianope ist (0,005% Chance), dann Überprüfung, ob die vorhergesagte Farbe und die Farbe gleich sind, falsch sein. Somit beträgt die Wahrscheinlichkeit 99,995% anstatt 100%.

Als Bonus können wir, da wir herausfanden, dass 9,995% der Testpersonen Lügner sind und es bekannt ist, dass alle Kreter Lügner sind , schlussfolgern, dass wir nicht auf Kreta sind!

Damon
quelle

1

Sie haben ein blaues Auto (nach objektiven wissenschaftlichen Maßstäben - es ist blau).

...

"Wie groß ist die Wahrscheinlichkeit, dass das Auto blau ist?"

Es ist 100% blau.

Sie wissen nur, dass 900 Leute sagten, es sei blau, und 100 sagten es nicht. Sie wissen nichts mehr über diese Leute (die 1000).

Mit diesen Zahlen (ohne jeden Kontext) ist völlig Unsinn. Es läuft alles auf persönliche Interpretation der Frage kommt es an. Wir sollten diesen Weg nicht gehen und Wittgensteins verwenden: "Wovon man nicht sprechen kann, darüber muss man schweigen."

Stellen Sie sich zum Vergleich folgende Frage vor:

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

Dies ist im Grunde das gleiche (informationslose) Problem, aber es ist viel klarer, dass das, was wir von der Farbe des Autos halten, größtenteils (wenn nicht vollständig) zufällig ist.

Wenn wir auf lange Sicht mehrere verknüpfte Fragen erhalten, können wir beginnen, Antworten auf solche unvollständigen Fragen zu erraten. Dies gilt auch für den TIT-FOR-TAT-Algorithmus, der in einem Einzelfall nicht funktioniert, aber auf lange Sicht funktioniert . In diesem Sinne kam Wittgenstein von seiner früheren Arbeit mit seinen Hauptuntersuchungen zurück . Wir sind in der Lage, diese Fragen zu beantworten, benötigen jedoch weitere Informationen / Versuche / Fragen. Es ist ein Prozess.

Martijn Weterings
quelle

0

Wenn wir davon ausgehen, dass das Auto blau ist, implizieren 100 von 1000, dass es nicht blau ist, eine extreme Stichprobenverschiebung. Vielleicht haben Sie nur farbenblinde Menschen befragt. Wenn wir annehmen, dass das Auto nicht blau ist, ist die Stichprobenverschiebung noch schlimmer. Alles, was wir aus den angegebenen Daten schließen können, ist, dass die Stichprobe sehr verzerrt ist, und da wir nicht wissen, wie sie verzerrt war, können wir keine Schlussfolgerungen über die Farbe des Autos ziehen.

Mike Scott
quelle

Ähm, ist die Tatsache, dass 900 Leute sagten, es sei blau, für etwas gut? Können wir nicht schlussfolgern, dass es wahrscheinlicher ist, blau zu sein als nicht? Denken Sie daran, dass der Befragte nur die Zahlen 900 und 100 kennt. Können sie also wirklich etwas über Voreingenommenheit sagen?

Pat Molloy

0

Es gab einige Antworten. Ich bin auf keinen Fall ein Mathematik-Guru, aber hier ist meine.

Es kann nur 4 Möglichkeiten geben:

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

Aus der Frage wissen Sie, dass die Summe aus Fall 1 und Fall 4 900 Personen (90%) und die Summe aus Fall 2 und Fall 3 100 Personen (10%) beträgt. Hier ist jedoch der Haken: Was Sie nicht wissen, ist die Verteilung innerhalb dieser 2 Fallpaare. Vielleicht besteht die Summe von Fall 1 und 4 vollständig aus Fall 1 (was bedeutet, dass das Auto blau ist), oder vielleicht besteht die gesamte Summe aus Fall 4 (was bedeutet, dass das Auto nicht blau ist). Gleiches gilt für die Summe von Fall 2 + 3. Also ... Sie müssen sich eine Möglichkeit einfallen lassen, um die Verteilung innerhalb der Fallsummen vorherzusagen. Ohne einen anderen Hinweis in der Frage (nirgendwo heißt es, dass die Leute zu 80% sicher sind, dass sie ihre Farben kennen oder so etwas), gibt es keine Möglichkeit, eine bestimmte, eindeutige Antwort zu finden.

Davon abgesehen ... Ich vermute, dass die erwartete Antwort in etwa so lautet:

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

Wenn die verbleibenden 50% einfach unbekannt sind, wird dies als Fehlerspanne bezeichnet.

Tuncay Göncüoğlu
quelle

0

$X,Y_1,Y_2,\ldots,Y_{1000} \in \{0,1\}$ $1$ $p(x)$ $p_x$ $Y_i|X=1$ $p_1$ $Y_i|X=0$ $p_0$ $\theta = (p_x,p_0,p_1)$

$p(\theta,x|y_{1:1000}) \propto p(\theta)p(x|\theta)\prod_{i=1}^{1000}p(y_i|x)$ . Eine solche Formulierung unterstreicht die Tatsache, dass Sie (zumindest wenn Sie ein Bayesianer sind) Prioritäten für diese drei Parameter auswählen müssen. Der bayesianische Standpunkt ist schön, weil Sie ausnutzen können, was Sie über die Häufigkeit von blauen Autos wissen und was Sie über die Tendenzen der Menschen wissen, mit der Realität übereinzustimmen.

$\{x_i\}$ $\{y_i|x\}$

Taylor
quelle

-3

Die Person, die das Auto nicht sehen kann, weiß nicht, dass es wissenschaftlich erwiesenermaßen blau ist. Die Wahrscheinlichkeit, dass das Auto blau ist, ist 50/50 (es ist blau oder es ist nicht blau). Die Befragung anderer Personen kann die Meinung dieser Person beeinflussen, ändert jedoch nichts an der Wahrscheinlichkeit, dass ein unsichtbares Auto blau ist oder nicht.

Alle obigen Berechnungen bestimmen die Wahrscheinlichkeit, dass Ihr Sample-Set bestimmen kann, ob es blau ist.

Körnerbrot
quelle

Ich bin nicht sicher, ob es stimmt, dass die Wahrscheinlichkeit, dass es blau ist, 50/50 ist. Tatsächlich sind es weit weniger als 50, da es sich um Rot, Weiß, Gelb usw. handeln kann. Die Wahrscheinlichkeit, dass ein zufällig ausgewähltes Auto blau ist, liegt weit unter 50%.

Benutzer

Wenn 900 von 1000 Menschen sagen, dass ein Auto blau ist, wie hoch ist die Wahrscheinlichkeit, dass es blau ist?

Antworten:

Einfache praktische Antwort:

Szenario 1: Es wird angenommen, dass Menschen Blau sehr gut erkennen können, wenn es blau ist ... 0%

Szenario 2: Menschen angenommen werden sehr gut , nicht-blau zu erkennen , wenn es nicht-blau ist ... 100%

Was ist die Definition von "blau"?