Hat diese Menge im Zusammenhang mit der Unabhängigkeit einen Namen?

18

Offensichtlich sind die Ereignisse A und B unabhängig, wenn Pr = Pr Pr . Definieren wir eine verwandte Menge Q:(AB)(A)(B)

QPr(AB)Pr(A)Pr(B)

Also sind A und B unabhängig, wenn Q = 1 ist (vorausgesetzt, der Nenner ist ungleich Null). Hat Q eigentlich einen Namen? Ich habe das Gefühl, dass es sich um ein elementares Konzept handelt, das mir gerade entgeht und dass ich mich ziemlich dumm fühlen werde, wenn ich das überhaupt gefragt habe.

Michael McGowan
quelle
1
Q=Pr(A|B)Pr(A)=Pr(B|A)Pr(B)
Pr(A|B)=QPr(A)Pr(B|A)=QPr(B)
Diese SE könnte mit ein paar "ziemlich dummen" Fragen fertig werden. Es ist sehr einschüchternd, auch für jemanden, der grundlegende Undergrad-Level-Statistiken genossen hat. +1 für
Albernheit
1
Gehen Sie für "Migdal Probability";)
Bitwise
1
@PiotrMigdal Danke für das nette Angebot. Ich würde es vorziehen, Ihre eigene Antwort zu sehen. Vielleicht auch, wie Sie auf diese Frage gekommen sind und wie diese Menge nützlich sein kann.

Antworten:

14

Es wird das erwartete Verhältnis eingehalten (Abkürzung: o / e ).

Zitiert eine Antwort auf Über die gemeinsame Wahrscheinlichkeit geteilt durch das Produkt der Wahrscheinlichkeiten bei Math.SE (von Procrastinator herausgestellt ):

Dann wird P (A∩B) / (P (A) P (B)) zumindest in der Literatur zu Umwelt-, Medizin- und Biowissenschaften als Verhältnis von beobachteten zu erwarteten Werten (Abkürzung o / e) bezeichnet. Die Idee ist, dass der Zähler die tatsächliche Wahrscheinlichkeit von A∩B ist, während der Nenner so ist, wie es wäre, wenn A und B unabhängig wären.

Piotr Migdal
quelle
11

Ich denke, dass Sie Lift(oder Verbesserung) suchen . Lift ist das Verhältnis der Wahrscheinlichkeit, dass A und B zusammen auftreten, zu dem Vielfachen der beiden Einzelwahrscheinlichkeiten für A und B. Es wird verwendet, um die Bedeutung einer Regel beim Assoziationsregel-Mining zu interpretieren . Lift ist eine Methode, um zu messen, um wie viel besser ein Modell über der Benchmark liegt. Als Lift wird das durch die Benchmark geteilte Vertrauen definiert, bei dem jeder Wert, der größer ist als derjenige, der darauf hindeutet, dass die Regel von Nutzen ist. Siehe diese Seite auch als weiteres Beispiel.

George Dontas
quelle
(+1) Gute Antwort. Die Arules-Vignette enthält auch einige gute Hinweise zum Thema Aufzug .
chl
Danke, wahrscheinlich habe ich das schon mal gesehen. Ich glaube, ich habe im Kontext des maschinellen Lernens schon einmal einen Unterschied bei der Definition gesehen ... Ich hasse es, dass es manchmal einen Mangel an Konsens über eine Definition gibt, während es manchmal viele Begriffe für dasselbe Konzept gibt.
Michael McGowan
8

Die Korrespondenzanalyse-Leute bezeichnen eine dieser Größen als Kontingenzverhältnis im Kontext von Kreuztabellenzählungen. Die Abstände mehrerer solcher Verhältnisse von 1 sind das, was Biplots visualisieren. Siehe z. B. Greenacre (1993), Kap. 13.

Die maschinelle Lernfunktionsauswahl der alten Schule nennt das Protokoll dieser Menge punktweise gegenseitige Informationen . Siehe z. B. Manning und Schütze (1999), S. 66.

Conjugateprior
quelle
Vielen Dank für den Hinweis auf "Kontingenzquote" und "punktweise gegenseitige Information".
Piotr Migdal
6

In Data Mining nennt man das wohl Lift .

RichardN
quelle
0

Vielleicht fragen Sie sich, in welchem ​​Verhältnis diese Größe zum Odds Ratio steht, um die Unabhängigkeit zu messen.

Ich denke, Sie suchen nach "Verhältnis zur statistischen Unabhängigkeit". Siehe http://en.wikipedia.org/wiki/Odds_ratio

Kenneth Cabrera
quelle