In Baby-Namensforen wiederholen potenzielle Eltern ständig eine Version ihrer Angst vor Jennifer: "Ich möchte nicht, dass mein Kind mit seinem Namen eines von fünf in seiner Klasse ist." Die Sache ist, dass kein Name mehr dieser Popularität nahe kommt, und selbst auf dem Höhepunkt des Jennifer-Wahnsinns haben Sie nicht fünf davon in einer Klasse bekommen. Ich hätte gerne eine Antwort für diese Eltern, wie unwahrscheinlich ein solches Zusammentreffen von Namenswiederholungen wäre.
Kann mir jemand anhand der umfangreichen Babynamen-Daten der Social Security Administration ( https://www.ssa.gov/oact/babynames/limits.html ) sagen, wie ich die Chancen einer Grundschulklasse in den USA mit fünf Kindern herausfinden kann gleichnamige Kinder? (Der Einfachheit halber meine ich mit "gleicher Name" die gleiche Schreibweise und mit "Schulklasse" meine ich, dass alle Kinder im selben Jahr geboren wurden.) Ich gebe keine Klassengröße an, aber sie sollte definitiv größer als 4 sein . :-)
quelle
Antworten:
Alle Daten finden Sie hier . Jeder Wert in der Tabelle stellt die Wahrscheinlichkeit dar, dass bei einer Stichprobe von 25 Personen von diesem Ort und Geburtsjahr 5 von ihnen einen Namen teilen.
Methode : Ich habe das Binomial-PDF für jeden Namen verwendet, um die Wahrscheinlichkeit zu ermitteln, dass eine bestimmte Klasse mit 25 Personen 5 Personen hat, die einen Namen gemeinsam haben:
Wenn beispielsweise insgesamt 4.000.000 Kinder und 21.393 Emily vorhanden sind, beträgt die Wahrscheinlichkeit, dass in einer bestimmten Klasse mit 25 Schülern 5 Emily vorhanden sind, Binomial (25, 5, 0,0053) = 0,0000002. Das Summieren aller Namen gibt keine genaue Antwort, da wir nach dem Einschluss- / Ausschlussprinzip auch die Möglichkeit berücksichtigen müssen, mehrere Gruppen von 5 Personen zu haben, die Namen teilen. Da diese Wahrscheinlichkeiten für alle praktischen Zwecke nahezu Null sind, habe ich angenommen, dass sie vernachlässigbar sind und somit .P(⋃Ai)≈∑P(Ai)
Update: Wie viele Leute betonten, gibt es im Laufe der Zeit und zwischen den Staaten erhebliche Unterschiede. Also habe ich das gleiche Programm auf STATE BY STATE-Basis und im Laufe der Zeit ausgeführt. Hier sind die Ergebnisse (landesweite Wahrscheinlichkeit ist rot, einzelne Staaten sind schwarz):
Interessanterweise war Vermont (mein Heimatstaat) in den letzten Jahrzehnten durchweg einer der wahrscheinlichsten Orte dafür.
quelle
Bitte beachten Sie das folgende Python-Skript für Python2.
Die Antwort ist von der Antwort von David C inspiriert.
Meine endgültige Antwort wäre, die Wahrscheinlichkeit, mindestens fünf Jacobs in einer Klasse zu finden, wobei Jacob nach den Daten von https://www.ssa.gov/oact/babynames/limits.html "National Data" der wahrscheinlichste Name ist "ab 2006.
Die Wahrscheinlichkeit wird nach einer Binomialverteilung berechnet, wobei die Jacob-Wahrscheinlichkeit die Erfolgswahrscheinlichkeit ist.
Max. Wahrscheinlichkeit für mindestens fünf gleichnamige Kinder von 25: 4.7e-07 für den Namen Jacob
Max. Wahrscheinlichkeit für mindestens fünf gleichnamige Kinder von 50: 1.6e-05 für den Namen Jacob natürlich.
Max. Wahrscheinlichkeit für mindestens fünf gleichnamige Kinder von 100: 0,00045 für den Namen Jacob natürlich.
Um den Faktor 10 das gleiche Ergebnis wie bei David C. Vielen Dank. (Meine Antwort summiert nicht alle Namen, sollte besprochen werden)
quelle