Ich sehe dieses berühmte Zitat überall, verstehe den hervorgehobenen Teil jedoch nicht jedes Mal.
Ein Mann, der eine Hypothese aus Gewohnheitsgründen provisorisch ablehnt, wenn die Signifikanz bei 1% oder höher liegt, wird mit Sicherheit in nicht mehr als 1% solcher Entscheidungen falsch liegen. Denn wenn die Hypothese richtig ist, wird er in nur 1% dieser Fälle verwechselt, und wenn sie falsch ist, wird er niemals in Ablehnung verwechselt. [...] Die Berechnung ist jedoch absurd akademisch, denn tatsächlich hat kein wissenschaftlicher Mitarbeiter ein festes Signifikanzniveau, bei dem er von Jahr zu Jahr und unter allen Umständen Hypothesen ablehnt; Vielmehr überlegt er jeden einzelnen Fall im Lichte seiner Beweise und seiner Ideen.Es sollte nicht vergessen werden, dass es sich bei den Fällen, die für die Anwendung eines Tests ausgewählt wurden, offensichtlich um eine hoch ausgewählte Gruppe handelt und dass die Auswahlbedingungen nicht einmal für einen einzelnen Arbeitnehmer festgelegt werden können. Weder dass es in dem verwendeten Argument eindeutig unzulässig wäre, das tatsächliche Signifikanzniveau zu wählen, das von einem bestimmten Prozess angegeben wird, als wäre es seine lebenslange Gewohnheit, nur dieses Niveau zu verwenden.
(Statistical Methods and Scientific Inference, 1956, S. 42-45)
Genauer gesagt verstehe ich nicht
- Warum werden die Fälle für die Anwendung eines Tests als "hoch ausgewählt" eingestuft? Angenommen, Sie fragen sich, ob die durchschnittliche Körpergröße von Personen in einem Bereich weniger als 165 cm beträgt, und beschließen, einen Test durchzuführen. Das Standardverfahren besteht meines Wissens darin, zufällige Stichproben aus dem Bereich zu ziehen und deren Höhe zu messen. Wie kann dies hoch ausgewählt werden?
- Angenommen, die Fälle sind hoch ausgewählt, aber wie hängt dies mit der Wahl des Signifikanzniveaus zusammen? Betrachten Sie das obige Beispiel noch einmal: Wenn Ihre Stichprobenmethode (die von Fisher als Auswahlbedingungen bezeichnet wird ) verzerrt ist und auf irgendeine Weise große Menschen bevorzugt, ist die gesamte Forschung ruiniert, und die subjektive Bestimmung des Signifikanzniveaus kann sie nicht speichern.
- Eigentlich weiß ich nicht einmal, worauf sich "das tatsächliche Signifikanzniveau eines bestimmten Prozesses" bezieht. Ist es der Wert dieses Experiments, ein voreingestellter Wert wie der (in) berühmte 0,05 oder etwas anderes?
quelle
Beim Versuch, den Hintergrund des Zitats zu sehen, bin ich zu einer Version des Buches gekommen (ich bin nicht sicher, welche Version welche ist), die ein etwas anderes Zitat hat
https://archive.org/details/in.ernet.dli.2015.134555/page/n47
Dies scheint mir eine Kritik zu sein, den mathematischen Ausdruck von Ablehnungsmöglichkeiten, Typ-I-Fehlern, als strenges Argument zu verwenden. Diese Ausdrücke sind oft kein guter Ausdruck für das, was relevant ist, und sie sind auch nicht streng.
Warum werden die Fälle für die Anwendung eines Tests als "hoch ausgewählt" eingestuft?
Dies scheint sich auf den Satz zu beziehen
Wir stehen der getesteten Hypothese nicht gleichgültig gegenüber, und oft wird angenommen, dass eine getestete Hypothese nicht wahr ist.
Wie hängt das mit der Wahl des Signifikanzniveaus zusammen?
Das bezieht sich auf
Der p-Wert ist nur die Häufigkeit der einen Fehler zu machen , wenn die Nullhypothese ist wahr. Die tatsächliche Fehlerhäufigkeit ist jedoch unterschiedlich (niedriger).
worauf bezieht sich "das tatsächliche Signifikanzniveau, das durch einen bestimmten Versuch angezeigt wird"?
Ich glaube, dieser Teil bezieht sich auf eine Art p-Wert-Hacking. Ändern des Signifikanzniveaus Alpha, nachdem die Beobachtungen stattgefunden haben, um dem beobachteten p-Wert zu entsprechen, und so tun, als wäre dies von Anfang an der Grenzwert.
quelle