Bei meiner Forschung bin ich auf das folgende allgemeine Problem gestoßen: Ich habe zwei Verteilungen und über dieselbe Domäne und eine große (aber endliche) Anzahl von Stichproben aus diesen Verteilungen. Die Proben sind unabhängig und identisch von einer dieser beiden Verteilungen verteilt (obwohl die Verteilungen verwandt sein können: Zum Beispiel kann eine Mischung aus und einer anderen Verteilung sein.) Die Nullhypothese lautet, dass die Proben von , die alternative Hypothese lautet: Proben stammen von .
Ich versuche, die Fehler vom Typ I und Typ II beim Testen der Probe zu charakterisieren, wobei ich die Verteilungen und . Insbesondere bin ich daran interessiert, neben der Kenntnis von und einen Fehler aufgrund des anderen zu begrenzen .
Ich habe gefragt Frage auf math.SE in Bezug auf das Verhältnis von Gesamt Variation Abstand zwischen und zu Hypothesenprüfung und erhielt eine Antwort , dass ich akzeptiert. Diese Antwort ist sinnvoll, aber ich konnte mich immer noch nicht mit der tieferen Bedeutung der Beziehung zwischen Gesamtvariationsabstand und Hypothesentest in Bezug auf mein Problem befassen. Daher habe ich mich entschlossen, mich diesem Forum zuzuwenden.
Meine erste Frage lautet: Ist die Gesamtvariation an die Summe der Wahrscheinlichkeiten von Typ I- und Typ II-Fehlern gebunden , unabhängig von der verwendeten Hypothesentestmethode? Im Wesentlichen muss die Wahrscheinlichkeit, dass mindestens einer der Fehler ungleich Null ist, solange es eine Wahrscheinlichkeit ungleich Null gibt, dass die Stichprobe durch eine der Verteilungen erzeugt worden sein könnte. Grundsätzlich können Sie sich der Möglichkeit nicht entziehen, dass Ihr Hypothesentester einen Fehler macht, egal wie viel Signalverarbeitung Sie ausführen. Und Total Variation begrenzt genau diese Möglichkeit. Ist mein Verständnis richtig?
Es gibt auch eine andere Beziehung zwischen Fehlern vom Typ I und II und den zugrunde liegenden Wahrscheinlichkeitsverteilungen und : die KL-Divergenz . Meine zweite Frage lautet daher: Ist die KL-Divergenz nur für eine bestimmte Hypothesentestmethode anwendbar (sie scheint häufig mit der Log-Likelihood-Ratio-Methode zu tun zu haben), oder kann man sie allgemein auf alle Hypothesentestmethoden anwenden? Wenn es für alle Hypothesentestmethoden anwendbar ist, warum scheint es sich dann so stark von der gebundenen Gesamtvariation zu unterscheiden? Benimmt es sich anders?Q.
Und meine zugrunde liegende Frage lautet: Gibt es eine Reihe vorgeschriebener Umstände, unter denen ich entweder gebunden verwenden sollte, oder ist es nur eine Frage der Bequemlichkeit? Wann sollte das mit einer Grenze abgeleitete Ergebnis unter Verwendung der anderen gebunden sein?
Ich entschuldige mich, wenn diese Fragen trivial sind. Ich bin Informatiker (das scheint mir also ein ausgefallenes Mustervergleichsproblem zu sein :).) Ich kenne die Informationstheorie ziemlich gut und habe auch einen Abschluss in Wahrscheinlichkeitstheorie. Ich fange jedoch gerade erst an, all diese Hypothesentests zu lernen. Bei Bedarf werde ich mein Bestes tun, um meine Fragen zu klären.
Antwort auf Ihre erste Frage: Ja, eins minus der gesamten Variationsentfernung ist eine Untergrenze für die Summe der Fehlerraten vom Typ I + Typ II. Diese Untergrenze gilt unabhängig davon, welchen Hypothesentestalgorithmus Sie wählen.
Begründung: Die Antwort, die Sie auf Math.SE erhalten haben, liefert den Standardbeweis für diese Tatsache. Korrigieren Sie einen Hypothesentest. Let bezeichnen die Menge der Ergebnisse , auf denen dieser Test die Nullhypothese ablehnen wird ( ein solcher Satz muss existieren immer). Dann beweist die Berechnung in der Math.SE-Antwort die Untergrenze.A
(Genau genommen geht diese Argumentation davon aus, dass Ihr Hypothesentest ein deterministisches Verfahren ist. Aber selbst wenn Sie randomisierte Verfahren berücksichtigen, kann gezeigt werden, dass dieselbe Grenze immer noch gilt.)
quelle