Erwartete Anzahl von Verhältnissen zwischen Mädchen und Jungen

45

Beim Eignungstest für Vorstellungsgespräche für kritisches Denken bin ich auf eine Frage gestoßen. Es geht ungefähr so:

Die Republik Zorganian hat einige sehr merkwürdige Bräuche. Paare wünschen sich nur weibliche Kinder, da nur weibliche das Vermögen der Familie erben können. Wenn sie also ein männliches Kind haben, bekommen sie so lange mehr Kinder, bis sie ein Mädchen haben. Wenn sie ein Mädchen haben, hören sie auf, Kinder zu haben. Wie ist das Verhältnis von Mädchen zu Jungen in Zorgania?

Ich bin mit der Antwort des Fragestellers, die etwa 1: 1 ist, nicht einverstanden. Die Rechtfertigung war, dass jede Geburt immer eine 50% ige Chance hat, männlich oder weiblich zu sein.

Können Sie mich mit einer mathematisch überzeugenderen Antwort von überzeugen wenn die Anzahl der Mädchen und B die Anzahl der Jungen im Land ist?GE[G]:E[B]G

Möbius Pizza
quelle
3
Sie sind mit der Antwort des Modells nicht einverstanden, da sich das M: F-Verhältnis der Geburten vom M: F-Verhältnis der Kinder unterscheidet. In realen menschlichen Gesellschaften greifen Paare, die nur weibliche Kinder haben möchten, wahrscheinlich auf Mittel wie Säuglingsmord oder Adoption im Ausland zurück, um männliche Kinder loszuwerden, was zu einem M: F-Verhältnis von weniger als 1: 1 führt.
Gabe
10
@Gabe Es gibt keine Erwähnung von Kindermord in der Frage, es ist eine mathematische Übung im Gegensatz zu einer groben Analyse eines realen Landes, in dem Mord an der Tagesordnung ist. Ebenso ist das reale Verhältnis der Geburten von Jungen zu Mädchen näher an 51:49 (ohne Berücksichtigung sozialer Faktoren)
Richard Tingle
2
Dank der Antworten verstehe ich jetzt, warum das Verhältnis 1: 1 sein würde, was für mich ursprünglich nicht intuitiv klingt. Einer der Gründe für meinen Unglauben und meine Verwirrung ist, dass ich weiß, dass Dörfer in China das gegenteilige Problem eines zu hohen Verhältnisses von Jungen zu Mädchen haben. Ich kann realistisch sehen, dass Paare sich nicht auf unbestimmte Zeit fortpflanzen können, bis sie das Geschlecht des Kindes bekommen, das sie wollen. In China sind laut Gesetz nur maximal 2 Kinder in ländlichen Gebieten erlaubt. In diesem Fall liegt das Verhältnis näher bei 3: 2 als 1: 1.
Möbius Pizza
4
@MobiusPizza: Nein, das Verhältnis ist 1: 1, egal wie viele Kinder du hast! Der Grund, warum China ein anderes Verhältnis hat, ist auf soziale Faktoren wie Kindsmord, geschlechtsspezifische Abtreibung und ausländische Adoption zurückzuführen.
Gabe
3
@newmount Simulationen sind gut, bedeuten aber nur so viel wie die darin enthaltenen Annahmen. Wenn nur der Code ohne Erklärung angezeigt wird, ist es für die Benutzer schwierig, diese Annahmen zu identifizieren. In Ermangelung einer solchen Begründung und Erklärung wird hier keine Menge an Simulationsausgaben die Frage beantworten. Was die "reale Welt" betrifft, muss jeder, der diese Behauptung aufstellt, Daten über menschliche Geburten vorlegen.
Whuber

Antworten:

46

Beginnen Sie ohne Kinder

Schritt wiederholen

{

Jedes Paar, das noch Kinder hat, hat ein Kind. Die Hälfte der Paare hat Männer und die Hälfte der Paare Frauen.

Die Paare, die Frauen haben, hören auf, Kinder zu haben

}

Bei jedem Schritt erhalten Sie eine gerade Anzahl von Männern und Frauen, und die Anzahl der Paare mit Kindern reduziert sich um die Hälfte (dh diejenigen, die Frauen hatten, haben im nächsten Schritt keine Kinder).

Sie haben also zu jeder Zeit die gleiche Anzahl von Männern und Frauen und von Schritt zu Schritt sinkt die Anzahl der Paare mit Kindern um die Hälfte. Wenn mehr Paare geschaffen werden, tritt die gleiche Situation wieder auf und alle anderen Dinge sind gleich, wird die Bevölkerung die gleiche Anzahl von Männern und Frauen enthalten

martino
quelle
6
Ich denke, dies ist eine hervorragende Möglichkeit, die Wahrscheinlichkeitsverteilung zu erklären, ohne sich auf einen strengen mathematischen Beweis zu stützen.
LBushkin
1
Was mir gefällt, ist, dass dies auch erklärt, was mit den überschüssigen Mädchen passiert ist, die Ihre Intuition erwartet: Die überschüssigen Mädchen werden von den Eltern gewünscht (sie sind die Eltern, die es erneut versuchen), aber diese Eltern schaffen (im Großen und Ganzen) nie erfolgreich einen Überschuss von Mädchen.
Ben Jackson
2
Sie könnten dies noch weiter vereinfachen, indem Sie sagen: "Wiederholen Sie Schritt {Jemand entscheidet, ob er ein Kind hat oder nicht}". Die Regeln, nach denen sie entscheiden, sind völlig irrelevant, vorausgesetzt, jeder bringt Jungen und Mädchen mit der gleichen Wahrscheinlichkeit unabhängig voneinander hervor. Es ist nicht einmal notwendig, einen Wert für diese Wahrscheinlichkeit anzunehmen. Sie können einfach sagen, dass die Häufigkeit in der Bevölkerung mit der Häufigkeit bei der Geburt übereinstimmt.
Steve Jessop
1
@martino Ich glaube nicht, dass dies der Fall ist, obwohl ich mich nicht wundern würde, wenn es eine sehr überzeugende Mathematik in dieser Hinsicht gäbe. Ich glaube, dieses Szenario führt zu einer Aufschlüsselung unseres Verhältnisses, da die erwartete Anzahl von Kindern pro Familie unendlich ist. Sie sollten Ihrer Antwort skeptisch gegenüberstehen, da die Frage in diesem Thread allgemein beantwortet wurde.
Jlimahaverford
1
@ martino. Zum Spaß habe ich gerade eine Simulation mit diesem Stoppkriterium durchgeführt. 10.000 Familien hatten insgesamt 160.693.469 Jungen (und diese Zahl plus 10.000 weitere Mädchen) bei einem Verhältnis von 0,9999377735896915. Ziemlich unglaubliches Zeug.
Jlimahaverford
37

Sei die Anzahl der Jungen in einer Familie. Sobald sie ein Mädchen haben, hören sie damit aufX

X=0if the first child was a girlX=1if the first child was a boy and the second was a girlX=2if the first two children were boys and the third was a girland so on

Wenn die Wahrscheinlichkeit ist, dass ein Kind ein Junge ist, und wenn die Geschlechter von den Kindern unabhängig sind, ist die Wahrscheinlichkeit, dass eine Familie Jungen hat, dh die Wahrscheinlichkeit, Jungen und dann ein Mädchen zu haben. Die erwartete Anzahl der Jungen ist Man beachte, dass wir erhalten k P ( X = k ) = p k( 1 - p ) , k E X = & Sigma; k = 0 k P k( 1 - p ) = & Sigma; k = 0 k P k - & Sigma; k = 0 k p k + 1 . k =pk

P(X=k)=pk(1p),
k
EX=k=0kpk(1p)=k=0kpkk=0kpk+1.
& Sigma; k = 0 kPk-& Sigma; k = 0 kP k + 1 =& Sigma; k = 0 (k+1)p k + 1 - k = 0 kp
k=0kpk=k=0(k+1)pk+1
& Sigma;k = 0 pk=1/(1-p)0<p<1
k=0kpkk=0kpk+1=k=0(k+1)pk+1k=0kpk+1=k=0pk+1=pk=0pk=p1p
wobei wir wenn (siehe geometrische Reihe ).k=0pk=1/(1p)0<p<1

Wenn , haben wir den . Das heißt, die durchschnittliche Familie hat 1 Jungen. Wir wissen bereits, dass alle Familien 1 Mädchen haben, daher wird das Verhältnis mit der Zeit gleich 1/1 .E X = 0,5 / 0,5 1 / 1 = 1p=1/2EX=0.5/0.51/1=1

Die Zufallsvariable ist als geometrische Zufallsvariable bekannt .X

MånsT
quelle
4
Dies setzt natürlich voraus, dass pdies für alle Familien gleich ist. Wenn wir stattdessen davon ausgehen, dass einige Paare eher Jungen als andere haben ( dh dass ihre Wahrscheinlichkeit phöher ist), ändert sich das Ergebnis, auch wenn der Durchschnittswert von pimmer noch 0,5 beträgt. (Dennoch ist dies eine hervorragende Erklärung für die grundlegenden Statistiken.)
Ben Hocking
2
@Ben Ihr Kommentar enthält eine Schlüsselidee. Das Gleiche war mir in den Sinn gekommen, deshalb habe ich meine Frage so bearbeitet, dass sie eine Analyse dieser realistischeren Situation enthält. Es zeigt sich, dass das Grenzverhältnis nicht unbedingt 1: 1 beträgt .
Whuber
1
@ BenHocking In der Tat! Und wie wir sowohl aus der modernen Statistik als auch aus Laplace's klassischer Analyse der Geburtenraten wissen, ist ohnehin nicht wirklich gleich . :)1 / 2p1/2
MånsT
21

Zusammenfassung

Das einfache Modell, dass alle Geburten unabhängig voneinander eine 50% ige Wahrscheinlichkeit haben, Mädchen zu sein, ist unrealistisch und, wie sich herausstellt, außergewöhnlich. Sobald wir die Konsequenzen unterschiedlicher Ergebnisse in der Bevölkerung betrachten, lautet die Antwort, dass das Verhältnis von Mädchen zu Jungen ein beliebiger Wert sein kann, der 1: 1 nicht überschreitet. (In Wirklichkeit wäre es wahrscheinlich immer noch nahe 1: 1, aber das muss von der Datenanalyse bestimmt werden.)

Da diese beiden widersprüchlichen Antworten unter der Annahme einer statistischen Unabhängigkeit der Geburtsergebnisse erzielt werden, ist ein Aufruf zur Unabhängigkeit keine ausreichende Erklärung. Daher scheint die Variation (in Bezug auf die Wahrscheinlichkeit weiblicher Geburten) die Schlüsselidee hinter dem Paradoxon zu sein.

Einführung

Ein Paradoxon liegt vor, wenn wir der Meinung sind, dass wir gute Gründe haben, etwas zu glauben, aber mit einem soliden gegenteiligen Argument konfrontiert sind.

Eine zufriedenstellende Lösung eines Paradoxons hilft uns zu verstehen, was an beiden Argumenten richtig war und was falsch gewesen sein könnte . Wie es bei Wahrscheinlichkeit und Statistik häufig der Fall ist, können beide Argumente tatsächlich gültig sein: Die Auflösung hängt von Unterschieden zwischen implizit getroffenen Annahmen ab . Der Vergleich dieser verschiedenen Annahmen kann uns dabei helfen, herauszufinden, welche Aspekte der Situation zu unterschiedlichen Antworten führen. Ich behaupte, diese Aspekte zu identifizieren, ist das, was wir am meisten schätzen sollten.

Annahmen

Wie aus allen bisher veröffentlichten Antworten hervorgeht, ist davon auszugehen, dass Geburten von Frauen unabhängig voneinander und mit einer konstanten Wahrscheinlichkeit von . Es ist allgemein bekannt, dass keine der beiden Annahmen tatsächlich zutrifft, aber es scheint, dass geringfügige Abweichungen von diesen Annahmen die Antwort nicht wesentlich beeinflussen sollten. Lass uns sehen. Betrachten Sie zu diesem Zweck das folgende allgemeinere und realistischere Modell:1/2

  1. In jeder Familie die Wahrscheinlichkeit einer weiblichen Geburt eine konstante , unabhängig von der Geburtsordnung.ipi

  2. In Ermangelung einer Stoppregel sollte die erwartete Anzahl weiblicher Geburten in der Bevölkerung in der Nähe der erwarteten Anzahl männlicher Geburten liegen.

  3. Alle Geburtsergebnisse sind (statistisch) unabhängig.

Dies ist immer noch kein vollständig realistisches Modell menschlicher Geburten, bei dem der mit dem Alter der Eltern (insbesondere der Mutter) variieren kann. Es ist jedoch hinreichend realistisch und flexibel, um eine zufriedenstellende Auflösung des Paradoxons bereitzustellen, das auch für allgemeinere Modelle gelten wird.pi

Analyse

Obwohl es interessant ist, eine gründliche Analyse dieses Modells durchzuführen, werden die wichtigsten Punkte auch dann deutlich, wenn eine bestimmte, einfache (aber etwas extreme) Version betrachtet wird. Angenommen, die Bevölkerung hat Familien. In der Hälfte dieser Fälle beträgt die Wahrscheinlichkeit einer weiblichen Geburt und in der anderen Hälfte beträgt die Wahrscheinlichkeit einer weiblichen Geburt . Dies erfüllt eindeutig die Bedingung (2): Die erwartete Anzahl weiblicher und männlicher Geburten ist gleich.2N2/31/3

Betrachten Sie diese ersten Familien. Lassen Sie uns über die Erwartungen nachdenken und verstehen, dass die tatsächlichen Ergebnisse zufällig sind und daher ein wenig von den Erwartungen abweichen. (Die Idee hinter der folgenden Analyse wurde in der ursprünglichen Antwort, die ganz am Ende dieses Beitrags erscheint, kurz und einfach wiedergegeben.)N

Sei die erwartete Anzahl weiblicher Geburten in einer Population von mit konstanter weiblicher Geburtswahrscheinlichkeit . Offensichtlich ist dies proportional zu und so kann geschrieben werden . Ebenso sei die erwartete Anzahl männlicher Geburten.f(N,p)NpNf(N,p)=f(p)Nm(p)N

  • Die ersten Familien bringen ein Mädchen zur Welt und hören auf. Die anderen Familien zeugen einen Jungen und gebären weiterhin Kinder. Das sind Girls und Boys.pN(1p)NpN(1p)N

  • Die verbleibenden Familien befinden sich in derselben Position wie zuvor:(1p)N Die Annahme der Unabhängigkeit (3) impliziert, dass das, was sie in Zukunft erleben, nicht durch die Tatsache beeinflusst wird, dass ihr Erstgeborener ein Sohn war. Somit werden diese Familien mehr Mädchen und mehr Jungen hervorbringen .f(p)[(1p)N]m(p)[(1p)N]

Addiert man die Gesamtzahl der Mädchen und Jungen und vergleicht sie mit ihren angenommenen Werten von und erhält man Gleichungenf(p)Nm(p)N

f(p)N=pN+f(p)(1p)N  and  m(p)N=(1p)N+m(p)(1p)N

mit Lösungen

f(p)=1  and  m(p)=1p1.

Die erwartete Anzahl von Mädchen in den ersten Familien mit ist daher und die erwartete Anzahl von Jungen ist .Np=2/3f(2/3)N=Nm(2/3)N=N/2

Die erwartete Anzahl von Mädchen in der zweiten Familie mit beträgt daher und die erwartete Anzahl von Jungen beträgt .Np=1/3f(1/3)N=Nm(1/3)N=2N

Die Summen sind Mädchen und Jungen. Für große das erwartete Verhältnis in der Nähe des Verhältnisses der Erwartungen.(1+1)N=2N(1/2+2)N=(5/2)NN

E(# girls# boys)2N(5/2)N=45.

Die Stopp-Regel begünstigt Jungen!

Im Allgemeinen gelten weiterhin die Bedingungen (1) bis (3) und das erwartete Verhältnis für große Ansätze , wenn die Hälfte der Familien unabhängig voneinander Mädchen mit der Wahrscheinlichkeit und die andere Hälfte Jungen mit der Wahrscheinlichkeit trägtp1pN

2p(1p)12p(1p).

Abhängig von , das natürlich zwischen und , kann dieser Wert irgendwo zwischen und (aber niemals größer als ). Es erreicht sein Maximum von nur, wenn . Mit anderen Worten, ein erwartetes Verhältnis von Mädchen zu Jungen von 1: 1 ist eine besondere Ausnahme von der allgemeineren und realistischeren Regel, dass das Stoppen mit dem ersten Mädchen mehr Jungen in der Bevölkerung begünstigt.p010111p=1/2

Auflösung

Wenn Ihre Intuition ist, dass das Stoppen mit dem ersten Mädchen mehr Jungen in der Bevölkerung hervorbringen sollte , dann sind Sie richtig, wie dieses Beispiel zeigt. Um korrekt zu sein, müssen Sie lediglich sicherstellen, dass die Wahrscheinlichkeit, ein Mädchen zur Welt zu bringen, in den Familien unterschiedlich ist (auch nur geringfügig).

Die "offizielle" Antwort, dass das Verhältnis in der Nähe von 1: 1 liegen sollte, erfordert mehrere unrealistische Annahmen und ist für diese sensibel: Es wird angenommen, dass es keine Unterschiede zwischen den Familien geben kann und dass alle Geburten unabhängig voneinander sein müssen.

Bemerkungen

Die Kernidee dieser Analyse ist, dass Variationen innerhalb der Bevölkerung wichtige Konsequenzen haben. Unabhängigkeit der Geburten - obwohl es sich um eine vereinfachenden Annahme für jede Analyse in diesem Thread verwendet - ist nicht das Paradox lösen, weil (abhängig von den anderen Annahmen) es im Einklang sowohl mit der offiziellen Antwort und ihr Gegenteil ist.

Es ist jedoch zu beachten, dass das erwartete Verhältnis wesentlich von 1: 1 abweichen kann, wenn wir eine große Variation unter den in der Population benötigen . Wenn alle beispielsweise zwischen 0,45 und 0,55 liegen, sind die Auswirkungen dieser Variation nicht sehr auffällig. Die Beantwortung dieser Frage, was die in einer menschlichen Population wirklich sind, erfordert einen ziemlich großen und genauen Datensatz. Man könnte ein verallgemeinertes lineares Mischmodell verwenden und auf Überdispersion testen .pipipi

Wenn wir das Geschlecht durch eine andere genetische Expression ersetzen, erhalten wir eine einfache statistische Erklärung der natürlichen Selektion : Eine Regel, die die Anzahl der Nachkommen basierend auf ihrer genetischen Veranlagung unterschiedlich begrenzt, kann die Proportionen dieser Gene in der nächsten Generation systematisch verändern. Wenn das Gen nicht geschlechtsgebunden ist, wird sogar ein geringer Effekt über mehrere Generationen multiplikativ verbreitet und kann schnell stark vergrößert werden.


Ursprüngliche Antwort

Jedes Kind hat eine Geburtsordnung: Erstgeboren, Zweitgeboren und so weiter.

Unter der Annahme gleicher Geburtswahrscheinlichkeiten von Männern und Frauen und keiner Korrelation zwischen den Geschlechtern wird nach dem schwachen Gesetz der großen Zahlen ein Verhältnis von erstgeborenen Frauen zu Männern von nahezu 1: 1 angenommen . Aus dem gleichen Grund wird es ein Verhältnis von 1: 1 zwischen zweitgeborenen Frauen und Männern geben, und so weiter. Da diese Verhältnisse konstant 1: 1 sind, muss das Gesamtverhältnis auch 1: 1 betragen, unabhängig davon, wie häufig die Geburtenordnungen in der Bevölkerung sind.

whuber
quelle
Interessant; Dies scheint, weil, obwohl keine Regel das Verhältnis vom natürlichen Verhältnis ändern kann, es die Anzahl der resultierenden Kinder ändern kann und diese Anzahl der Kinder vom natürlichen Verhältnis abhängt. In Ihrem Beispiel haben Sie also zwei Elternpopulationen, die unterschiedlich betroffen sind. (Das heißt, dies fühlt sich an wie eine Situation außerhalb des Rahmens des implizierten fiktiven Landes, die eher eine mathematische Übung ist)
Richard Tingle
@Richard Es könnte sich nur so anfühlen, weil ich es der Erläuterung halber stark vereinfacht habe. In Wirklichkeit würde man die Population mit einer Verteilung von mit einem Mittelwert von modellieren . Sofern die Varianz dieser Verteilung nicht Null ist, impliziert dieselbe Analyse dieselben Schlussfolgerungen, einschließlich der Tatsache, dass das erwartete Verhältnis von Mädchen zu Jungen streng unter . Dies zeigt, dass die populäre Schlussfolgerung (dass das Verhältnis 1: 1 sein muss) entscheidend von der Annahme abhängt, dass keine Variation vorliegt. Ich werde mich nicht dafür entschuldigen, Mathematik zu verwenden, um darüber nachzudenken, was das Interesse des Ergebnisses nicht mindert. pi1/21
Whuber
1
Sie sollten sich auch nicht entschuldigen, dies ist ein sehr interessantes Ergebnis (ich dachte wirklich wow, als ich es las). Ich würde es nur in der Form "Ursprüngliches Ergebnis", "Realistischere Situation" vorziehen. Die Art und Weise, wie es geschrieben ist, fühlt sich wie Betrug an (was unfair ist, weil es, wie ich sage, sehr interessant ist), weil ich genauso leicht sagen könnte: "Nun, offensichtlich ist es nicht 1: 1, weil männliche Geburten häufiger sind" (ich glaube aufgrund unserer historischen Mietverhältnisse) im bewaffneten Konflikt zu sterben)
Richard Tingle
@ Richard Das ist ein guter Punkt. Ich habe es unterlassen, realistischere Versionen der Frage zu diskutieren, wie etwa das Ändern des Mittelwerts von auf etwa (was übrigens nichts mit bewaffneten Kämpfen zu hat: es hat eine biologische Erklärung), weil der Beitrag zu lang war ist und es sollte klar sein, wie man seine Methoden auf diesen Fall verallgemeinert. Ich würde es vorziehen, mich weiterhin auf die Lösung des Paradoxons zu konzentrieren, das darin besteht, einen natürlichen (aber möglicherweise übersehenen) Mechanismus zu finden, der den offensichtlichen Konflikt zwischen mehreren scheinbar gültigen Antworten verdeutlicht und erklärt. 0,51pi0.51
whuber
@whuber Danke für die informative Antwort. Ich verstehe nicht, warum Sie in Ihrer Berechnung die Bevölkerung in zwei Familien mit unterschiedlicher Wahrscheinlichkeit, Mädchen zur Welt zu bringen, aufgeteilt haben. Gemäß Punkt 1 Ihrer Modellannahme sollte das p_i für alle Familien gleich sein. Warum haben Sie die Bevölkerung in zwei Arten von Familien aufgeteilt?
Möbius Pizza
14

Die Geburt jedes Kindes ist ein unabhängiges Ereignis mit P = 0,5 für einen Jungen und P = 0,5 für ein Mädchen. Die anderen Details (wie die Familienentscheidungen) lenken Sie nur von dieser Tatsache ab. Die Antwort lautet also, dass das Verhältnis 1: 1 ist .

Um dies zu erläutern: Stellen Sie sich vor, Sie werfen keine Kinder, sondern eine schöne Münze (P (Köpfe) = 0,5), bis Sie einen "Kopf" erhalten. Sagen wir, Familie A wirft die Münze und erhält die Folge von [Schwänzen, Schwänzen, Köpfen]. Dann wirft Familie B die Münze und bekommt einen Schwanz. Nun, wie hoch ist die Wahrscheinlichkeit, dass der nächste Kopf kommt? Immer noch 0,5 , denn das bedeutet unabhängig . Wenn Sie dies mit 1000 Familien machen würden (was bedeutet, dass 1000 Köpfe auftauchten), wäre die erwartete Gesamtzahl der Schwänze 1000, da jeder Schlag (Ereignis) völlig unabhängig war.

Einige Dinge sind nicht unabhängig, wie zum Beispiel die Reihenfolge innerhalb einer Familie: Die Wahrscheinlichkeit der Reihenfolge [Köpfe, Köpfe] ist 0, ungleich [Schwänze, Schwänze] (0,25). Aber da die Frage nicht danach fragt, ist es irrelevant.

Tim S.
quelle
3
Wie gesagt, das ist falsch. Wenn die Geschlechter bedingungslos unabhängig wären, gäbe es auf lange Sicht so viele Mädchen-Mädchen-Sequenzen bei Geburten in den Familien wie Jungen-Jungen-Sequenzen. Es gibt viele der letzteren und nie einen der ersteren. Es gibt eine Form der Unabhängigkeit, die jedoch von der Reihenfolge der Geburt abhängig ist .
Whuber
1
@whuber Wir werden nicht gefragt, wie viele Girl-Girl-Sequenzen es gibt. Nur das Verhältnis von Mädchen zu Jungen. Ich habe nicht gesagt, dass die Abfolge der Geburten einer einzelnen Mutter eine Reihe unabhängiger Ereignisse ist, wie Münzwürfe. Nur, dass jede einzelne Geburt ein eigenständiges Ereignis ist.
Tim S.
Sie müssen diesbezüglich viel klarer sein. Ich habe die Sequenzen erwähnt, um die mangelnde Unabhängigkeit zu demonstrieren. Sie müssen also genau angeben , in welchem strengen Sinne "Unabhängigkeit" hier gilt.
Whuber
@whuber Die Ereignisse sind in gleicher Weise unabhängig wie Münzwürfe. Ich habe dies in meiner Antwort dargelegt.
Tim S.
3
@whuber die Mädchen-Mädchen-Sequenzen tauchen auf, wenn Sie alle Geburten in einer Zeile setzen; Nachdem ein Paar das nächste beendet hat, gehen Sie in usw. usw.
Richard Tingle
6

Stellen Sie sich vor, Sie werfen eine schöne Münze, bis Sie einen Kopf sehen. Wie viele Schwänze wirfst du?

P(0 tails)=12,P(1 tail)=(12)2,P(2 tails)=(12)3,...

Die erwartete Anzahl von Schwänzen wird leicht mit 1 berechnet *.

Die Anzahl der Köpfe beträgt immer 1.

* Wenn Sie nicht klar ist, siehe ‚Umriss Beweis‘ hier

Glen_b
quelle
6

Am häufigsten sind Paare mit genau einem Mädchen und keinem Jungen

Der Grund dafür ist, dass die Wahrscheinlichkeit eines Szenarios, in dem es mehr Mädchen gibt, viel größer ist als in den Szenarios, in denen es mehr Jungen gibt. Und die Szenarien, in denen es viel mehr Jungen gibt, haben sehr niedrige Wahrscheinlichkeiten. Die genaue Funktionsweise ist unten dargestellt

NumberOfChilden Probability  Girls   Boys  
1               0.5           1       0  
2               0.25          1       1  
3               0.125         1       2  
4               0.0625        1       3  
...             ...           ...     ...  

NumberOfChilden Probability   Girls*probabilty   Boys*probabilty 
1               0.5           0.5                0
2               0.25          0.25               0.25
3               0.125         0.125              0.25
4               0.0625        0.0625             0.1875
5               0.03125       0.03125            0.125
...             ...           ...                ...  
n               1/2^n         1/(2^n)            (n-1)/(2^n)

Sie können ziemlich genau sehen, wohin dies zu diesem Zeitpunkt geht, die Summe der Mädchen und Jungen wird sich zu eins summieren.

Erwartete Mädchen von einem Paar Erwartete Jungen von einem Paar=n=1(12n)=1
=n=1(n1n2)=1

Begrenzen Sie die Lösungen von wolfram

Jede Geburt, in welcher Familie auch immer, hat eine 50: 50-Chance, ein Junge oder ein Mädchen zu sein

Dies alles ist von Natur aus sinnvoll, da Sie die Wahrscheinlichkeit, dass eine bestimmte Geburt ein Junge oder ein Mädchen ist, nicht kontrollieren können (versuchen Sie es als Paar). Es spielt keine Rolle, ob ein Kind einem Paar ohne Kinder oder einer Familie mit hundert Jungen geboren wird; Die Chance ist 50:50. Wenn also jede einzelne Geburt eine 50:50 Chance hat, sollten Sie immer die Hälfte der Jungen und die Hälfte der Mädchen bekommen. Und es spielt keine Rolle, wie Sie die Geburten zwischen den Familien mischen; Sie werden das nicht beeinflussen.

Dies funktioniert für jede 1- Regel

Aufgrund der 50: 50-Chance für jede Geburt ergibt sich ein Verhältnis von 1: 1 für jede (vernünftige 1 ) Regel, die Sie aufstellen können. Zum Beispiel funktioniert die folgende ähnliche Regel auch gerade

Paare haben keine Kinder mehr, wenn sie ein Mädchen oder zwei Kinder haben

NumberOfChilden Probability   Girls   Boys
1               0.5           1       0
2               0.25          1       1
2               0.25          0       2

In diesem Fall lässt sich die Summe der erwarteten Kinder leichter berechnen

Erwartete Mädchen von einem Paar Erwartete Jungen von einem Paar=0.51+0.251=0.75
=0.251+0.252=0.75

1 Wie ich bereits sagte, funktioniert dies für jede vernünftige Regel, die in der realen Welt existieren könnte. Eine unvernünftige Regel wäre eine, bei der die erwarteten Kinder pro Paar unendlich sind. Beispiel: "Eltern hören erst auf, Kinder zu haben, wenn sie doppelt so viele Jungen wie Mädchen haben". Wir können die gleichen Techniken wie oben anwenden, um zu zeigen, dass diese Regel unendlich viele Kinder ergibt:

NumberOfChilden Probability   Girls   Boys
3               0.125         1       2
6               1/64          2       4
9               1/512         3       6
3*m             1/((3m)^2     m       2m

Wir können dann die Anzahl der Eltern mit einer begrenzten Anzahl von Kindern finden

Erwartete Anzahl von Eltern mit endlichen Kindern=m=1(11/(3m)2)=π254=0.18277.

Begrenzen Sie die Lösungen von wolfram

So können wir feststellen, dass 82% der Eltern eine unendliche Anzahl von Kindern haben würden; Aus städtebaulicher Sicht würde dies wahrscheinlich zu Schwierigkeiten führen und zeigt, dass dieser Zustand in der realen Welt nicht existieren kann.

Richard Tingle
quelle
3
Dass die Geburten nicht unabhängig voneinander sind, zeigt die Untersuchung von Geburtssequenzen: Die Sequenz Mädchen-Mädchen erscheint nie, während Jungen-Jungen-Sequenzen häufig vorkommen.
Whuber
1
@whuber Ich verstehe Ihren Standpunkt (obwohl es wohl eher die Entscheidung ist, überhaupt ein Kind abhängig zu machen, als das Ergebnis des Ereignisses selbst), wäre es möglicherweise besser zu sagen, dass die Wahrscheinlichkeit einer zukünftigen Geburt, ein Junge zu sein, unabhängig ist von allen früheren Geburten "
Richard Tingle
Ja, ich denke, es gibt hier einen Weg, die Unabhängigkeit zu retten. Aber das bringt - glaube ich - den Kern der Sache auf den Punkt, so dass es anscheinend notwendig ist, einige sorgfältige Überlegungen zu diesem Thema anzustellen, um der Forderung des OP nach einer "energischen" (rigorosen?) Demonstration nachzukommen.
Whuber
@whuber Um ehrlich zu sein, dass der erste Absatz das Handwave-Bit ist, sollten die weiteren Absätze (und insbesondere die Grenzen) das rigorose Bit sein
Richard Tingle
Kein Argument, aber das letztere Material wurde bereits in den Antworten unter stats.stackexchange.com/a/93833 , stats.stackexchange.com/a/93835 und stats.stackexchange.com/a/93841 auf die gleiche Weise behandelt .
Whuber
5

Sie können auch die Simulation verwenden:

p<-0
for (i in 1:10000){
  a<-0
  while(a != 1){   #Stops when having a girl
    a<-as.numeric(rbinom(1, 1, 0.5))   #Simulation of a new birth with probability 0.5
    p=p+1   #Number of births
  }
}
(p-10000)/10000   #Ratio
Aghila
quelle
1
Die Simulationsergebnisse sind insofern gut, als sie uns etwas Trost geben können, als wir bei einer mathematischen Herleitung keinen schwerwiegenden Fehler gemacht haben, aber sie sind weit von der verlangten strengen Demonstration entfernt. Insbesondere wenn seltene Ereignisse auftreten können, die einen großen Beitrag zur Erwartung leisten (z. B. eine Familie mit 20 Jungen, bevor ein Mädchen auftaucht - was bei einer Simulation von nur 10.000 Familien höchstwahrscheinlich nicht der Fall ist), können die Simulationen instabil oder instabil sein auch nur falsch, egal wie lange sie iteriert werden.
Whuber
Das Erkennen der geometrischen Verteilung der Anzahl der Jungen in der Familie ist der Schlüsselschritt zu diesem Problem. Versuchen Sie:mean(rgeom(10000, 0.5))
AdamO
5

Durch das Auswerten konnte ich besser erkennen, wie das Verhältnis der geborenen Bevölkerung (angenommen 1: 1) und das Verhältnis der Kinderpopulation beide 1: 1 betragen würden. Während einige Familien mehrere Jungen, aber nur ein Mädchen haben würden, was mich anfänglich zu der Annahme veranlasste, dass es mehr Jungen als Mädchen geben würde, würde die Anzahl dieser Familien nicht mehr als 50% betragen und sich mit jedem weiteren Kind um die Hälfte verringern, während die Die Anzahl der Ein-Mädchen-Familien würde 50% betragen. Die Anzahl der Jungen und Mädchen würde sich somit ausgleichen. Sehen Sie sich die Summen von 175 unten an. Kinderquote

Lowe Rudd
quelle
2

Was Sie bekommen haben, war die einfachste und die richtige Antwort. Wenn die Wahrscheinlichkeit, dass ein Neugeborenes ein Junge ist, p ist und Kinder des falschen Geschlechts nicht durch unglückliche Unfälle getroffen werden, spielt es keine Rolle, ob die Eltern aufgrund des Geschlechts des Kindes entscheiden, ob sie mehr Kinder haben. Wenn die Anzahl der Kinder N und N groß ist, können Sie mit etwa p * N Jungen rechnen. Eine kompliziertere Berechnung ist nicht erforderlich.

Es gibt sicherlich andere Fragen, wie "Wie groß ist die Wahrscheinlichkeit, dass das jüngste Kind einer Familie mit Kindern ein Junge ist" oder "wie groß ist die Wahrscheinlichkeit, dass das älteste Kind einer Familie mit Kindern ein Junge ist". (Einer hat eine einfache richtige Antwort, der andere hat eine einfache falsche Antwort und es ist schwierig, eine richtige Antwort zu bekommen).

gnasher729
quelle
2

Lassen

Ω={(G),(B,G),(B,B,G),}

sei der Probenraum und lass

X: ΩRω|ω|-1

Sei die Zufallsvariable, die jedes Ergebnis, , auf die Anzahl der Jungen abbildet . Der Erwartungswert von Jungen, , ergibt sich dann zu E (X)ωE(X)

E(X)=n=1(n-1)0.5n=1 ,

Trivialerweise ist der erwartete Wert von Mädchen 1. Das Verhältnis ist also auch 1.

user3451767
quelle
2

Es ist eine Trickfrage. Das Verhältnis bleibt gleich (1: 1). Die richtige Antwort ist, dass es die Geburtenrate nicht beeinflusst, aber die Anzahl der Kinder pro Familie mit einem begrenzenden Faktor von durchschnittlich 2 Geburten pro Familie.

Dies ist die Art von Frage, die Sie bei einem Logiktest finden können. Bei der Antwort geht es nicht um die Geburtenrate. Das ist eine Ablenkung.

Dies ist keine Wahrscheinlichkeitsfrage, sondern eine Frage des kognitiven Denkens. Auch wenn Sie mit 1: 1 geantwortet haben, haben Sie den Test nicht bestanden.

Andrew - OpenGeoCode
quelle
Ich habe meine Antwort kürzlich bearbeitet, um zu zeigen, dass die Lösung nicht unbedingt 1: 1 ist, was Ihren Behauptungen ausdrücklich widerspricht.
Whuber
Ich habe deine Antwort gelesen. Sie haben ein Prädikat eingeführt, das nicht im Problem angegeben ist (Varianz der Geburtenrate von Frauen). An dem Problem liegt nichts, was behauptet, dass die Zorganian Republic für die menschliche Bevölkerung oder sogar für Menschen repräsentativ ist.
Andrew - OpenGeoCode
1
Das ist richtig - aber es gibt auch nichts, was die vereinfachte Annahme rechtfertigt, dass alle Geburtswahrscheinlichkeiten gleich sind. Es müssen Annahmen getroffen werden, um eine objektive, vertretbare Antwort zu liefern, so dass zumindest eine gute Antwort explizit über die getroffenen Annahmen ist und diese Annahmen stützt. Die Behauptung, dies sei keine Wahrscheinlichkeitsfrage, geht die Probleme nicht an, sondern übersieht sie gänzlich.
whuber
@whuber - Die Geburtenrate in diesem Problem ist eine Invariante. Die Variante des Problems ist die Anzahl der Geburten pro Familie. Die Frage ist eine Ablenkung, sie ist nicht Teil des Problems. <br/> Querdenken ist die Fähigkeit, kreativ zu denken oder „über den Tellerrand hinaus“ zu denken, wie es im Geschäftsleben manchmal genannt wird, um mithilfe Ihrer Inspiration und Ihrer Vorstellungskraft Probleme zu lösen, indem Sie sie aus unerwarteten Perspektiven betrachten. Laterales Denken bedeutet, das Offensichtliche zu verwerfen, traditionelle Denkweisen hinter sich zu lassen und Vorurteile auszuräumen. [Ich bin ein
leitender
1
Sie haben vielleicht einen wichtigen Punkt in meiner Antwort übersehen: Seine Annahmen halten auch die bevölkerungsgemittelte Wahrscheinlichkeit einer weiblichen Geburt bei 1: 1 (auf eine bestimmte Art und Weise, von der ich hoffe, dass sie klar beschrieben wurde). Ich würde behaupten, dass bei jeder Lösung eines Paradoxons, bei der Annahmen kritisch geprüft werden, ein substantielles "Querdenken" eine Rolle spielt: Es erfordert Vorstellungskraft und gute analytische Fähigkeiten, um zu sehen, dass man überhaupt Annahmen macht. Jegliche Frage als bloßen "Trick" abzulehnen, wie Sie es hier tun, scheint dem Fördern oder Feiern eines solchen Denkens zu widersprechen.
whuber
2

Ich zeige den Code, den ich für eine Monte-Carlo-Simulation (500x1000 Familien) mit der MATLAB-Software geschrieben habe. Bitte überprüfen Sie den Code, damit ich keinen Fehler gemacht habe.

Das Ergebnis wird unten generiert und grafisch dargestellt. Es zeigt, dass die simulierte Wahrscheinlichkeit der Geburt eines Mädchens sehr gut mit der zugrunde liegenden natürlichen Geburtswahrscheinlichkeit übereinstimmt, unabhängig von der Abbruchregel für einen Bereich natürlicher Geburtswahrscheinlichkeiten.

Bildbeschreibung hier eingeben

Wenn man mit dem Code herumspielt, ist es einfacher, einen Punkt zu verstehen, den ich vorher nicht ganz getan habe - wie der andere betont, ist die Stopp-Regel eine Ablenkung. Die Abbruchregel betrifft nur die Anzahl der Familien bei fester Bevölkerungszahl oder aus einer anderen Sicht die Anzahl der Geburten bei fester Familienzahl. Das Geschlecht wird ausschließlich durch das Würfeln bestimmt, und daher hängt das Verhältnis oder die Wahrscheinlichkeit (unabhängig von der Anzahl der Kinder) ausschließlich vom natürlichen Verhältnis der Jungen zu Mädchen ab.

testRange=0.45:0.01:0.55;
N=uint32(100000); %Used to approximate probability distribution
M=1000; %Number of families
L=500; %Monte Carlo repetitions
Nfamily=zeros(length(testRange),1);
boys=zeros(length(testRange),1);
girls=zeros(length(testRange),1);
for l = 1:L
    j=1; %Index variable for the different bgratio
    for bgratio=testRange
    k=1; %Index variable for family in each run (temp family id)
    vec=zeros(N,1);
    vec(1:N*bgratio,1)=1; %Approximate boy:girl population for dice roll, 
    %1 = boy

    vec=vec(randperm(s,N)); %Random permutation, technically not necessary 
    %due to randi used later, just be safe
    bog = vec(randi(N)); %boy or girl? (God's dice roll)

    while k<M %For M families...
        if bog == 1 %if boy:
            boys(j) = boys(j)+1; %total global boys tally
        else
            girls(j)=girls(j)+1; %total global girls tally
            %Family stops bearing children
            Nfamily(j) = Nfamily(j)+1; %total global family tally
            k=k+1; %temp family id
            %Next family...
        end
        bog=vec(randi(N)); %Sample next gender (God's dice roll)
    end

    j=j+1; %Index variable for the different bgratio
    end
end
figure;
scatter(testRange,girls./(boys+girls))
hold on
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.44 0.56 0.44 0.56])
Möbius Pizza
quelle
2

ithXi0.5

E[iXi]=iE[Xi]=0.5nn

In ähnlicher Weise ist die erwartete Anzahl von Mädchen = .E[i(1Xi)]=iE[1Xi]=0.5n

Die Unabhängigkeit der Geburten ist für die Berechnung der Erwartungswerte unerheblich.


Antwort von Apropos @ whuber: Wenn es eine Variation der Grenzwahrscheinlichkeit zwischen den Familien gibt, wird das Verhältnis zu Jungen verzerrt, da mehr Kinder in Familien mit einer höheren Wahrscheinlichkeit für Jungen als Familien mit einer niedrigeren Wahrscheinlichkeit leben und dadurch eine verstärkende Wirkung von haben die erwartete Wertsumme für die Jungen.

Innuo
quelle
2

Unabhängig davon habe ich auch eine Simulation in matlab programmiert, bevor ich gesehen habe, was andere getan haben. Streng genommen ist es kein MC, weil ich das Experiment nur einmal durchführe. Aber einmal reicht aus, um Ergebnisse zu erzielen. Hier ist, was meine Simulation ergibt. Ich beziehe mich nicht auf die Wahrscheinlichkeit von Geburten mit p = 0,5 als Primitiv. Ich lasse die Geburtswahrscheinlichkeit über einen Bereich von Pr (Boys = 1) = 0,25: 0,05: 0,75 variieren.

Meine Ergebnisse zeigen, dass sich das Geschlechterverhältnis von 1 unterscheidet, da die Wahrscheinlichkeit von p = 0,5 abweicht: In Erwartung ist das Geschlechterverhältnis einfach das Verhältnis der Wahrscheinlichkeit der Geburt eines Jungen zur Wahrscheinlichkeit der Geburt eines Mädchens. Das heißt, dies ist eine geometrische Zufallsvariable, wie sie zuvor durch @ månst identifiziert wurde. Dies ist, was ich glaube, das ursprüngliche Plakat war intuitiv.

Meine Ergebnisse ahmen genau nach, was das obige Poster mit dem Matlab-Code bewirkt hat, wobei die Geschlechterverhältnisse mit den Wahrscheinlichkeiten von 0,45, 0,50 und 0,55, mit denen ein Junge geboren wird, übereinstimmen. Ich präsentiere meine, während ich einen etwas anderen Ansatz verfolge, um mit schnellerem Code zu den Ergebnissen zu gelangen. Um den Vergleich durchzuführen, habe ich den Codeabschnitt vec = vec (randperm (s, N)) weggelassen, da s in ihrem Code nicht definiert ist und ich die ursprüngliche Absicht dieser Variablen nicht kenne (auch dieser Codeabschnitt erscheint - wie ursprünglich - überflüssig angegeben).

Ich poste meinen Code

clear all; rng('default')

prob_of_boy = 0.25:0.05:0.75;
prob_of_girls = 1 - prob_of_boy;

iterations = 200;

sex_ratio = zeros(length(prob_of_boy),1);
prob_of_girl_est = zeros(length(prob_of_boy),1);
rounds_of_reproduction = zeros(length(prob_of_boy),1);

for p=1:length(prob_of_boy)

    pop = 1000000;

    boys = zeros(iterations,1);
    girls = zeros(iterations,1);
    prob_of_girl = zeros(iterations,1);

    for i=1:iterations

        x = rand(pop,1);
        x(x<prob_of_boy(p))=1;

        %count the number of boys and girls
        num_boys = sum(x(x==1));

        boys(i) = num_boys;
        girls(i) = pop - num_boys;

        prob_of_girl(i) = girls(i)/(pop);

        %Only families that had a boy continue to reproduce
        x = x(x==1);

        %new population of reproducing parents
        pop = length(x);

        %check that there are no more boys 
        if num_boys==0

            boys(i+1:end)=[];
            girls(i+1:end)=[];
            prob_of_girl(i+1:end)=[];
            break

        end
    end

    prob_of_girl_est(p) = mean(prob_of_girl(prob_of_girl~=0));
    sex_ratio(p) = sum(boys)/sum(girls);
    rounds_of_reproduction(p) = length(boys);
end

scatter(prob_of_girls,prob_of_girl_est)
hold on
title('Est. vs. True Probability of a Girl Birth')
ylabel('Est. Probability of Girl Birth')
xlabel('True Probability of Girl Birth')
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.2 0.8 0.2 0.8])

scatter(prob_of_girls,sex_ratio)
hold on
title('Sex Ratio as a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Sex Ratio: $\frac{E(Boys)}{E(Girls)}$','interpreter','latex')

scatter(prob_of_girls,rounds_of_reproduction)
hold on
title('Rounds of Reproduction a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Rounds of Reproduction')

Das folgende Diagramm wird aufgrund des starken Gesetzes der großen Anzahl erwartet. Ich reproduziere es, aber der Graph, der zählt, ist der zweite Graph.

Bildbeschreibung hier eingeben

Eine andere Bevölkerungswahrscheinlichkeit als 0,5 für die Geburt eines Kindes beiderlei Geschlechts ändert das Geschlechterverhältnis in der Gesamtbevölkerung. Unter der Annahme, dass Geburten unabhängig sind (aber nicht die Wahl, die Fortpflanzung fortzusetzen), bestimmt in jeder Runde der bedingten Fortpflanzung die Bevölkerungswahrscheinlichkeit die Gesamtzusammensetzung der Ergebnisse von Jungen- und Mädchengeburten. Wie andere bereits erwähnt haben, ist die Stop-Regel in dem Problem für das Ergebnis der Population unerheblich, wie dies vom Poster beantwortet wurde, das dies als geometrische Verteilung identifizierte.

Bildbeschreibung hier eingeben

Der Vollständigkeit halber wirkt sich die Stoppregel auf die Anzahl der Reproduktionsrunden in der Bevölkerung aus. Da ich das Experiment nur einmal durchführe, ist die Grafik etwas gezackt. Aber die Intuition ist da: Bei einer gegebenen Bevölkerungsgröße sehen wir, dass Familien mit zunehmender Wahrscheinlichkeit der Geburt eines Mädchens weniger Runden der Reproduktion benötigen, um das gewünschte Mädchen zu erhalten, bevor die gesamte Bevölkerung aufhört, sich zu reproduzieren (offensichtlich hängt die Anzahl der Runden von der Häufigkeit ab) Bevölkerungszahl, da es mechanistisch die Wahrscheinlichkeit erhöht, dass eine Familie zum Beispiel 49 Jungen hat, bevor sie ihr erstes Mädchen bekommt)

Bildbeschreibung hier eingeben

Der Vergleich zwischen meinen berechneten Geschlechterverhältnissen:

[sex_ratio' prob_of_boy']

0.3327    0.2500
0.4289    0.3000
0.5385    0.3500
0.6673    0.4000
0.8186    0.4500
1.0008    0.5000
1.2224    0.5500
1.5016    0.6000
1.8574    0.6500
2.3319    0.7000
2.9995    0.7500

und die aus dem vorherigen Poster mit dem Matlab-Code:

[boys./girls testRange']

0.8199    0.4500
0.8494    0.4600
0.8871    0.4700
0.9257    0.4800
0.9590    0.4900
1.0016    0.5000
1.0374    0.5100
1.0836    0.5200
1.1273    0.5300
1.1750    0.5400
1.2215    0.5500

Sie sind äquivalente Ergebnisse.

Alberto Ramírez
quelle
1

Das hängt von der Anzahl der Familien ab.

Xp=0.5

P(X=x)=0.5x,x=1,2,3...
E(X)=2

N

NXi

Xi/NE(X)=2N

TT=XiT

P(T=t)=CN1t10.5t,t=N,N+1...

E[NXi]=E[NT]=t=NNtCN1t10.5t=2F1(N,1,N+1,1)
2F1

2F1(N,1,N+1,1)

Randy Lai
quelle