Warum ist normalerweise die akzeptable Wahrscheinlichkeit von Fehlern vom Typ 1 und Typ 2 unterschiedlich?

8

Diese Frage wird von meinem Vorgesetzten gestellt und ich weiß nicht, wie ich sie erklären soll.

Normalerweise beträgt das akzeptierte Konfidenzniveau 0,95, was bedeutet, dass die Wahrscheinlichkeit eines Fehlers vom Typ 1 5% beträgt. Die normalerweise akzeptierte Leistung beträgt jedoch 0,8 (Cohen, 1988), was bedeutet, dass die Wahrscheinlichkeit eines Fehlers vom Typ 2 20% beträgt. Warum können wir eine höhere Wahrscheinlichkeit eines Fehlers vom Typ 2 akzeptieren als einen Fehler vom Typ 1? Gibt es einen statistischen Grund dafür?

Er fragte auch nach der physikalischen Bedeutung von Macht = 0,8 (warum sie als Kriterium ausgewählt wurde), von der ich auch keine Ahnung habe, sie zu erklären.

Und wenn wir die Leistungsanalyse verwenden, um das Experiment zu entwerfen, können wir die effektive Größe 0,3, 0,5 oder 0,8 auswählen, um die kleinen, mittleren und großen Effekte darzustellen. Und mein Vorgesetzter fragte, warum diese Nummern ausgewählt sind. Mein Verständnis ist, dass diese Zahlen aufgrund von Erfahrungen vorgeschlagen werden. Er fragte mich sofort, was die Erfahrung ist. Ich bin wirklich frustrierend über solche Fragen. Mein Hauptfach ist nicht Statistik und ich muss viel Zeit mit solchen Fragen verbringen, die meiner Meinung nach möglicherweise nicht sinnvoll sind. Kann jemand vorschlagen, ob solche Fragen wirklich sinnvoll sind oder nicht? Wenn ja, wie soll ich die Antwort herausfinden?

user2230101
quelle
2
Weder die 5% -Typ-1-Fehlerrate noch die 80% -Leistungsrate sind universell. Ich bezweifle, dass Ihr durchschnittlicher Physiker überhaupt von Cohen gehört hat.
Glen_b -Rate State Monica
1
Eine abgestumpfte, zynische, aber wahrscheinlich teilweise korrekte Antwort lautet: "Das werden Rezensenten in Ihrem Bereich verlangen."
whuber

Antworten:

8

Weder die 5% -Typ-1-Fehlerrate noch die 80% -Leistungsrate sind universell. Beispielsweise neigen Teilchenphysiker dazu, ein "5-Sigma" -Kriterium zu verwenden, das einer fiktiven Fehlerrate vom Typ I entspricht, die ungefähr in der Größenordnung von eins zu einer Million liegt. Ich bezweifle, dass Ihr durchschnittlicher Physiker überhaupt von Cohen gehört hat.

Ein Grund, warum die beiden von Ihnen angegebenen Fehlerraten unterschiedlich sein sollten, ist, dass die Kosten für die beiden Fehlertypen nicht gleich sind.

Ein Teil des Grundes (ein Teil des historischen Hintergrunds für die Konvention) wird hier diskutiert, warum die Fehlerrate des Typs I häufig mit 5% angenommen wird .

Glen_b -Reinstate Monica
quelle
Danke vielmals! (1) Erstens kann ich verstehen, dass der Fehler vom Typ 1 von 5% und 80% der Leistung nicht universell sind. (2) Könnten Sie in Bezug auf "die Kosten der beiden Fehlertypen wären nicht gleich" näher darauf eingehen? (3) Die Angabe der 5% des Fehlers vom Typ I ist sehr nützlich. Haben Sie zufällig ähnliche Informationen für Fehler vom Typ II (Leistung = 0,8)? Nochmals vielen Dank und Entschuldigung, dass ich nicht für Ihre Antwort stimmen kann, da ich keinen ausreichenden Ruf habe.
user2230101
1
(2) Betrachten Sie den Unterschied zwischen der Nichtidentifizierung eines vorhandenen Effekts und der Identifizierung eines fehlenden Effekts als vorhanden. Unter bestimmten Umständen sind die Folgen der zweiten geringfügig (was zu einer kostengünstigen, aber nutzlosen Behandlung führt), in anderen Situationen kann sie jedoch viel bedeutender sein. Umgekehrt kann der Typ-II-Fehler eine entscheidende oder eine weniger wichtige Verbesserung übersehen (z. B. das Fehlen einer Heilung für Ebola oder das Fehlen eines Haarfärbemittels, das einige Tage länger anhält). (3) Die 80% Leistung ist viel weniger verbreitet. Ich habe keinen gleichwertigen Hintergrund dafür; Sie wissen bereits über Cohen.
Glen_b -Rate State Monica