Ein Lehrer an meiner Universität stellte eine solche Frage (nicht für Hausaufgaben, da der Unterricht beendet ist und ich nicht dabei war). Ich kann nicht herausfinden, wie ich es angehen soll.
Die Frage betrifft 2 Beutel mit jeweils verschiedenen Obstsorten:
Der erste Beutel enthält die folgenden zufällig ausgewählten Früchte:
+ ------------- + -------- + --------- + | Durchmesser cm | Masse g | verfault? | + ------------- + -------- + --------- + | 17,28 | 139,08 | 0 | | 6,57 | 91,48 | 1 | | 7.12 | 74,23 | 1 | | 16,52 | 129,8 | 0 | | 14,58 | 169,22 | 0 | | 6,99 | 123,43 | 0 | | 6,63 | 104,93 | 1 | | 6,75 | 103,27 | 1 | | 15.38 | 169,01 | 1 | | 7,45 | 83,29 | 1 | | 13.06 | 157,57 | 0 | | 6.61 | 117,72 | 0 | | 7.19 | 128,63 | 0 | + ------------- + -------- + --------- +
Der zweite Beutel enthält 6 zufällig ausgewählte Früchte aus demselben Geschäft wie der erste Beutel. Die Summe ihrer Durchmesser beträgt 64,2 cm und 4 sind faul.
Geben Sie eine Schätzung für die Masse des zweiten Beutels.
Ich kann sehen, dass es zwei verschiedene Arten von Früchten mit normalverteilten Durchmessern und Massen zu geben scheint, aber ich bin nicht sicher, wie ich vorgehen soll.
regression
estimation
Rutilusk
quelle
quelle
Antworten:
Beginnen wir mit dem Zeichnen der Daten und werfen einen Blick darauf. Dies ist eine sehr begrenzte Datenmenge, daher wird dies mit vielen Annahmen etwas ad hoc sein .
Das sind also die Daten, rote Punkte stehen für faule Früchte:
Sie gehen zu Recht davon aus, dass es zwei Arten von Früchten zu geben scheint. Die Annahmen, die ich mache, sind die folgenden:
Da die Summe des Durchmessers 64,2 cm beträgt, sind höchstwahrscheinlich zwei Früchte groß und vier klein. Jetzt gibt es 3 Fälle für das Gewicht. Es gibt 2, 3 oder 4 kleine Früchte, die faul sind ( eine große Frucht, die faul ist, beeinflusst die Masse nicht durch Annahme ). Jetzt können Sie Grenzen für Ihre Masse ermitteln, indem Sie diese Werte berechnen.
Wir können empirisch die Wahrscheinlichkeit abschätzen, dass die Anzahl der kleinen Früchte verfault ist. Wir verwenden die Wahrscheinlichkeiten, um unsere Schätzungen der Masse in Abhängigkeit von der Anzahl der faulen Früchte zu gewichten:
Geben Sie uns eine endgültige Schätzung von 691,5183 g . Ich denke, Sie müssen die meisten Annahmen treffen, die ich getroffen habe, um zu einer Schlussfolgerung zu gelangen, aber ich denke, es könnte möglich sein, dies auf intelligentere Weise zu tun. Außerdem probiere ich empirisch, um die Wahrscheinlichkeit der Anzahl fauler kleiner Früchte zu ermitteln, das ist nur Faulheit und kann "analytisch" durchgeführt werden.
quelle
Ich würde den folgenden Ansatz vorschlagen:
All dies ist mit einem einfachen Skript zu handhaben.
quelle
Mehrere Ansätze umfassen, vom einfachsten bis zum komplexen,
. . .
kombinatorische Methoden
Die Ansätze sind in der Reihenfolge der Einfachheit der Berechnung angeordnet, nicht in der Reihenfolge, in der ein Ansatz besser oder überhaupt gut ist. Die Auswahl des zu verwendenden Ansatzes hängt davon ab, welche Merkmale der Bevölkerung bekannt sind oder angenommen werden. Wenn zum Beispiel die Massen von Früchten in der Ladenpopulation normal verteilt und unabhängig von Durchmesser und Fäulnisstatus sind, könnte man den ersten, einfachsten Ansatz ohne Vor- (oder sogar Nachteile des Stichprobenfehlers mehrerer Variablen) der Verwendung komplexerer Ansätze verwenden . Wenn nicht unabhängige, identisch verteilte Zufallsvariablen vorhanden sind, ist eine komplexere Auswahl in Abhängigkeit von bekannten oder angenommenen Informationen über die Population möglicherweise besser.
quelle