Ich habe das Gefühl, dass ich dieses Thema schon einmal gesehen habe, aber ich konnte nichts Bestimmtes finden. Andererseits bin ich mir auch nicht sicher, wonach ich suchen soll.
Ich habe einen eindimensionalen Satz von bestellten Daten. Ich gehe davon aus, dass alle Punkte in der Menge aus derselben Verteilung gezogen werden.
Wie kann ich diese Hypothese testen? Ist es sinnvoll, gegen eine allgemeine Alternative von "die Beobachtungen in diesem Datensatz stammen aus zwei verschiedenen Verteilungen" zu testen?
Im Idealfall möchte ich herausfinden, welche Punkte aus der "anderen" Verteilung stammen. Könnte ich, da meine Daten bestellt sind, mit der Identifizierung eines Schnittpunkts davonkommen, nachdem ich irgendwie getestet habe, ob es "gültig" ist, die Daten zu schneiden?
Edit: Laut Antwort von Glen_b wäre ich an streng positiven, unimodalen Distributionen interessiert. Mich würde auch der Sonderfall interessieren, eine Verteilung anzunehmen und dann auf verschiedene Parameter zu testen .
quelle
Antworten:
Stellen Sie sich zwei Szenarien vor:
Die Datenpunkte wurden alle aus derselben Verteilung gezogen - einer, die auf (16,36) einheitlich war.
Die Datenpunkte wurden aus einem 50-50-Mix von zwei Populationen gezogen:
ein. Bevölkerung A, die wie folgt geformt ist:
b. Population B, wie folgt geformt:
... so dass die Mischung der beiden genau wie in 1 aussieht.
Wie konnte man sie auseinanderhalten?
Unabhängig von der Form, die Sie für zwei Populationen wählen, wird es immer eine einzige Bevölkerungsverteilung geben, die dieselbe Form hat. Dieses Argument zeigt deutlich, dass man es für den allgemeinen Fall einfach nicht kann. Es gibt keine Möglichkeit zur Differenzierung.
Wenn Sie Informationen über die Populationen (Annahmen, effektiv) einbringen, gibt es oft Möglichkeiten, um fortzufahren *, aber der allgemeine Fall ist tot.
* Wenn Sie beispielsweise annehmen, dass die Populationen unimodal sind und über ausreichend unterschiedliche Mittel verfügen, können Sie irgendwohin gelangen
[Es gibt Einschränkungen, die der Frage hinzugefügt wurden, die nicht ausreichen, um eine andere Version des oben beschriebenen Problems zu vermeiden. Wir können immer noch eine unimodale Null in die positive Halblinie als eine 50: 50-Mischung aus zwei unimodalen Verteilungen schreiben auf der positiven halben Linie. Wenn Sie eine spezifischere Null haben, ist dies natürlich weniger ein Problem. Alternativ sollte es weiterhin möglich sein, die Klasse der Alternativen weiter einzuschränken, bis wir in der Lage waren, gegen eine Mischungsalternative zu testen. Oder es könnten einige zusätzliche Einschränkungen sowohl für Null als auch für Alternative gelten, die sie unterscheidbar machen würden.]
quelle
Sie müssen offensichtlich eine Theorie haben, um über die Verteilung (en) zu sprechen und Hypothesen zu testen. Etwas, das Motive in einer oder mehreren Gruppen gruppiert, und etwas, das Messungen durchführt, um sie auseinander zu halten.
Wie kann man dorthin gelangen? Ich sehe drei Möglichkeiten:
Die Übung lässt dann den Schluss zu, dass eine oder mehrere Gruppen in Ihrer Stichprobe vertreten sind oder nur eine. Oder überhaupt keine Gruppe.
quelle