Wie teste ich einen Interaktionseffekt mit einem nicht parametrischen Test (z. B. einem Permutationstest)?

10

Ich habe zwei kategoriale / nominale Variablen. Jeder von ihnen kann nur zwei unterschiedliche Werte annehmen (also habe ich insgesamt 4 Kombinationen).

Jede Wertekombination enthält eine Reihe numerischer Werte. Ich habe also 4 Sätze von Zahlen. Um es konkreter zu machen, nehmen wir an, ich habe male / femaleund young / oldals nominelle Variablen und ich habe weightals abhängige numerische "Ausgabe".

Ich weiß, dass der Übergang von malezu femaledas Durchschnittsgewicht verändert und diese Veränderungen statistisch signifikant sind. So kann ich einen genderFaktor berechnen . Gleiches gilt für die ageVariable. Ich weiß, dass der Übergang von youngzu olddas Durchschnittsgewicht ändert und ich kann den entsprechenden ageFaktor berechnen .

Was ich nun wirklich sehen möchte, wenn die Daten beweisen, dass der Übergang von jungen Frauen zu alten Männern eher eine Kombination aus Geschlechts- und Altersfaktoren ist. Mit anderen Worten, ich möchte wissen, ob Daten belegen, dass es "2D-Effekte" gibt, oder mit anderen Worten, dass Alters- und Geschlechtseffekte nicht unabhängig voneinander sind. Zum Beispiel könnte es sein, dass das Älterwerden bei Männern das Gewicht um den Faktor 1,3 erhöht und bei Frauen der entsprechende Faktor 1,1 beträgt.

Natürlich kann ich die beiden genannten Faktoren berechnen (Altersfaktor für Männer und Altersfaktor für Frauen) und sie sind unterschiedlich. Aber ich möchte die statistische Signifikanz dieses Unterschieds berechnen. Wie real ist dieser Unterschied?

Wenn möglich, möchte ich einen nicht parametrischen Test durchführen. Ist es möglich, das zu tun, was ich tun möchte, indem ich die vier Sätze mische, sie mische, neu aufteile und etwas berechne?

römisch
quelle
2
Eine Schwierigkeit beim nichtparametrischen Umgang mit Interaktionen besteht darin, dass eine monotone Transformation der Antwort vorhandene Interaktionen entfernen, Interaktionen induzieren kann, wenn sie nicht vorhanden sind, oder die Richtung der Interaktion umkehren kann. Dies deutet darauf hin, dass beispielsweise rangbasierte Ansätze möglicherweise nicht das tun, was Sie von ihnen erwarten.
Glen_b -State Monica
Bei Permutationstests für die ursprünglichen Variablen haben Sie dieses Problem nicht, aber es stellt sich heraus, dass es keine genauen Interaktionstests gibt. Sie können einige ungefähre Tests erhalten.
Glen_b -State Monica

Antworten:

5

Es gibt nichtparametrische Interaktionstests. Grob gesagt ersetzen Sie die beobachteten Gewichte durch ihre Ränge und behandeln den resultierenden Datensatz als heteroskedastische ANOVA. Schauen Sie sich zB "Nichtparametrische Methoden in Fakultätsentwürfen" von Brunner und Puri (2001) an.

Die Art der nichtparametrischen Interaktion, an der Sie interessiert sind, kann in dieser Allgemeinheit jedoch nicht gezeigt werden. Du sagtest:

Mit anderen Worten, ich möchte wissen, ob Daten belegen, dass es "2D-Effekte" gibt, oder mit anderen Worten, dass Alters- und Geschlechtseffekte nicht unabhängig voneinander sind. Zum Beispiel könnte es sein, dass das Älterwerden bei Männern das Gewicht um den Faktor 1,3 erhöht und bei Frauen der entsprechende Faktor 1,1 beträgt.

Letzteres ist unmöglich. Nichtparametrische Wechselwirkungen müssen einen Vorzeichenwechsel beinhalten, dh das Älterwerden erhöht das Gewicht der Männer, verringert jedoch das Gewicht der Frauen. Ein solcher Vorzeichenwechsel bleibt auch dann bestehen, wenn Sie die Gewichte monoton transformieren. Sie können jedoch eine monotone Transformation für die Daten auswählen, die die Gewichtszunahme um den Faktor 1,1 so nahe wie möglich an 1,3 abbildet. Natürlich werden Sie niemals einen signifikanten Unterschied zeigen, wenn er so nah sein kann, wie Sie möchten.

Wenn Sie wirklich an Interaktionen ohne Vorzeichenwechsel interessiert sind, sollten Sie sich an die übliche parametrische Analyse halten. Dort sind monotone Transformationen, die "den Unterschied schlucken", nicht erlaubt. Dies sollten Sie natürlich auch bei der Modellierung und Interpretation Ihrer Statistiken berücksichtigen.

Horst Grünbusch
quelle
1

Wenn Sie der Meinung sind, dass die Auswirkungen von Alter und Geschlecht mehr als nur die individuellen Auswirkungen sind, können Sie das ModellDer Koeffizient erfasst die Größe des "2D" -Effekts von Alter und Geschlecht. Sie können die t-Statistik von überprüfen , um eine ungefähre Vorstellung davon zu erhalten, ob sich das in Ihrem Modell beobachtete erheblich von .γ γ γ γ = 0weighti=αagei+βgenderi+γ(genderiagei).γγγγ=0

Hier ist ein sehr grobes grafisches Beispiel, um zu zeigen, was dieser zusätzliche multiplikative Begriff bewirkt.genderiagei

In der Modellantwort versuchen wir im Wesentlichen, eine einfache Hyperebene an die Daten anzupassenresponse=x1+x2

Geben Sie hier die Bildbeschreibung ein

Dieses Modell ist in den Kovariaten linear, daher die lineare Form, die Sie im obigen Diagramm sehen.

Andererseits ist die Modellantwort in und nicht linear und ermöglicht daher ein gewisses Maß an Krümmungresponse=x1+x2+x1x2x1x2

Geben Sie hier die Bildbeschreibung ein

Wenn Sie die Hypothese, dass ist, nicht ablehnen, bedeutet dies, dass Sie nicht ablehnen, dass das Modell eine gewisse Krümmung dieser Form aufweist.γ=0

In Bezug auf einen nicht parametrischen Test können Sie etwas in der Art tun, wie Sie es vorgeschlagen haben, indem Sie Bootstrap-Standardfehler für . Dies bedeutet, dass Sie mehrmals: 1) Ihre Daten durch Ersetzen abtasten, 2) den linearen Modus neu berechnen, 3) eine Schätzung . Nachdem Sie viele Schätzungen für , können Sie das -Quantil verwenden, um ein nicht parametrisches -Konfidenzintervall für einzurichten . Weitere Informationen hierzu finden Sie in Google unter "Bootstrap-Standardfehler".γγ^γ^50±p%2p%γ

Mustafa S Eisa
quelle
Wie kann dies nicht linear sein, wenn x1 und x2 nur Werte von 0 oder 1 annehmen können? Wie würde Gamma in Ihrem Beispiel irgendeine Form von Krümmung erklären?
5ayat
Es spielt keine Rolle, um welche Domäne es sich handelt, sie ist immer noch nicht linear, da die Funktion nicht als lineare Kombination ihrer Argumente geschrieben werden kann (dh ). Beachten Sie für Ihren zweiten Punkt, dass ich sorgfältig "ein sehr grobes grafisches Beispiel" gesagt habe. Dies ist ein kontinuierliches Analogon des Binärfalls. αR2:x1+x2+x1x2=i=12αixi
Mustafa S Eisa
Ich werde jedoch hinzufügen, dass Sie diese Funktion linear behandeln können, wenn die Domäne binär ist (was den Eckpunkten des 2D-Würfels entspricht). Die funktionale Form ist jedoch streng nichtlinear.
Mustafa S Eisa
@MustafaMEisa, ich habe noch nie einen Interaktionsterm in einem linearen Modell gesehen, der mit "den Eckpunkten eines 2D-Würfels" erklärt wurde. Es wäre informativ, wenn Sie näher darauf eingehen könnten.
5ayat
@ HorstGrünbusch, ich bin auch gespannt auf Ihren Kommentar zu dieser Antwort, da Sie bereits einen hilfreichen Kommentar zu meiner Antwort abgegeben haben.
5ayat
1

Wie andere angemerkt haben, kann dies linear mit einer Interaktion modelliert werden. Sie interagieren mit zwei Dummies, und daran ist nichts Nichtlineares. In Anbetracht des Modells: Der marginale Effekt 'gender' ist die partielle Ableitung:

wt=α+b1age+b2gender+b3agegender+ϵ

wtgender=b2+b3age

Sehen Sie, wie wir, wenn Geschlecht und Alter nur Werte von 0 oder 1 annehmen können, im Wesentlichen nur einen Mittelwertunterschied für vier verschiedene Gruppen betrachten? Das heißt, wir haben nur die vier verschiedenen Kombinationen, die wir in die obigen Gleichungen einfügen können: (1) und , (2) und , (3) und und (4) und . Ihr spezifisches Beispiel entspricht also einem Vergleich zwischen vier Gruppenmitteln.gender=0age=0gender=1age=1gender=0age=1gender=1age=0

Es kann auch hilfreich sein, diese Diskussion zu sehen, um zu verstehen, wie das oben Gesagte ANOVA mit zwei interagierten nominalen Variablen entspricht. Als weitere Möglichkeit, die Tatsache zu wiederholen, dass wir mit Ihrem spezifischen Beispiel (auch hier gibt es nur vier mögliche Kombinationen von Alter und Geschlecht) auch ein Modell wie das folgende ohne expliziten Interaktionsbegriff angeben könnten:

wt=α+b1young.male+b2old.male+b3young.female+ϵ

Wenn als Referenzkategorie weggelassen wird und beispielsweise der Koeffizient ein zwischen und . Wo der Schnitt wird auch durchschnittliche gleich innerhalb (wiederum die Referenzkategorie).old.femaleb1old.femaleyoung.maleαwtold.female

Probieren Sie es mit Ihren eigenen Daten aus. Mit einem linearen Modell mit einer Interaktion, einer ANOVA mit einer Interaktion oder der Verwendung von Dummies für jede der Gruppen ohne Interaktion erhalten Sie dieselben Ergebnisse. Ziemlich cool, oder? Ein Statistikbuch könnte jede dieser Methoden in einem anderen Kapitel aber alle Wege führen nach Rom. Zu sehen, wie dies mit Ihren eigenen Daten funktioniert, ist eine der besten Möglichkeiten, dies zu lernen.

Die obigen Beispiele sind daher ein zu komplizierter Weg, um zu dieser Schlussfolgerung zu gelangen (dass wir wirklich nur vier Gruppenmittelwerte vergleichen), aber um zu lernen, wie Interaktionen funktionieren, halte ich dies für eine hilfreiche Übung. Es gibt andere sehr gute Beiträge im Lebenslauf über die Interaktion einer kontinuierlichen Variablen mit einer nominalen Variablen oder die Interaktion zweier kontinuierlicher Variablen. Obwohl Ihre Frage bearbeitet wurde, um nichtparametrische Tests zu spezifizieren, halte ich es für hilfreich, Ihr Problem anhand eines konventionelleren (dh parametrischen) Ansatzes zu betrachten, da die meisten nichtparametrischen Ansätze für Hypothesentests dieselbe Logik haben, aber im Allgemeinen mit weniger Annahmen über bestimmte Verteilungen.

Die Frage stellte sich jedoch speziell nach einem nichtparametrischen Ansatz, der beispielsweise angemessener sein könnte, wenn wir bestimmte Annahmen über die Normalität von nicht treffen wollten . Ein geeigneter nichtparametrischer Test wäre Dunns Test . Dieser Test ähnelt dem Wilcoxon-Mann-Whitney-Rang-Summen-Test, weist jedoch mehr als zwei Kategorien auf.wt

Andere Permutationstests können ebenfalls geeignet sein, wenn Sie einen bestimmten Unterschied in den Mitteln hatten, mit denen Sie beispielsweise gegen . Unabhängig davon, ob Sie R verwenden oder nicht, bietet die Dokumentation des Münzpakets eine gute Zusammenfassung verschiedener nichtparametrischer Tests und unter welchen Umständen diese Tests angemessen sein könnten. old.menyoung.women

Kurz neben "signifikanten" Interaktionen

Manchmal sehen Sie Aussagen wie "Die Interaktion zwischen und war statistisch signifikant." Solche Aussagen sind nicht unbedingt falsch, aber irreführend. Wenn ein Autor dies schreibt, sagt er normalerweise, dass der Koeffizient für den Interaktionsterm statistisch signifikant war. Dies ist jedoch ein bedingungsloser Effekt in einem bedingten Modell. Ein genauerer Bericht würde sagen, dass " über 'einige Werte' von statistisch signifikant war", wobei alle anderen Kovariaten auf einem vernünftigen Wert wie einem Mittelwert, Median oder Modus konstant gehalten wurden.x1x2x1x2Wenn wir jedoch nur zwei Kovariaten haben, die nur Werte von 0 oder 1 annehmen können, bedeutet dies, dass wir im Wesentlichen vier Gruppenmittelwerte betrachten.

Gearbeitetes Beispiel

Vergleichen wir die Ergebnisse des Interaktionsmodells mit den Ergebnissen des Dunn-Tests. Lassen Sie uns zunächst einige Daten generieren, bei denen (a) Männer mehr wiegen als Frauen, (b) jüngere Männer weniger wiegen als ältere Männer und (c) es keinen Unterschied zwischen jüngeren und älteren Frauen gibt.

set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))

Schätzen Sie das Interaktionsmodell und erhalten Sie das vorhergesagte aus dem Randeffekt (Paket mit den Effekten). Sehen Sie hier , warum wir wollen nicht die bedingungslosen Effekte in einem Modell wie folgt zu interpretieren. Stattdessen wollen wir marginale Effekte interpretieren. Das Modell erkennt die Unterschiede, die wir bei der Generierung unserer Beispieldaten auferlegt haben, anständig.wt

mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)

 model: wt ~ age * gender

 age*gender effect
       gender
age         male   female
  old   80.61897 57.70635
  young 67.78351 56.01228

Müssen Sie einen Standardfehler oder ein Konfidenzintervall für Ihren Randeffekt berechnen? Das oben erwähnte "Effekt" -Paket kann dies für Sie tun, aber noch besser, Aiken und West (1991) geben Ihnen die Formeln, selbst für viel kompliziertere Interaktionsmodelle. Ihre Tabellen sind bequem gedruckt hier , zusammen mit sehr guten Kommentar von Matt Golder.

Nun, um Dunns Test zu implementieren.

#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")

Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0


                           Comparison of x by group                            
                             (Benjamini-Hochberg)                              
Col Mean-|
Row Mean |    old.men   young.me   young.wo
---------+---------------------------------
young.me |   3.662802
         |    0.0002*
         |
young.wo |   7.185657   3.522855
         |    0.0000*    0.0003*
         |
old.wome |   6.705346   3.042544  -0.480310
         |    0.0000*    0.0014*     0.3155

Der p-Wert des Kruskal-Wallis-Chi-Quadrat-Testergebnisses legt nahe, dass mindestens eine unserer Gruppen "aus einer anderen Population stammt". Bei den gruppenweisen Vergleichen ist die obere Zahl Dunns Z-Test-Statistik und die untere Zahl ein p-Wert, der für mehrere Vergleiche angepasst wurde. Da unsere Beispieldaten eher künstlich waren, ist es nicht überraschend, dass wir so viele kleine p-Werte haben. Beachten Sie jedoch den Vergleich unten rechts zwischen jüngeren und älteren Frauen. Der Test unterstützt korrekt die Nullhypothese, dass zwischen diesen beiden Gruppen kein Unterschied besteht.

Sowohl das Interaktionsmodell als auch Dunns Test führen uns zu ähnlichen Schlussfolgerungen. In allen oben angegebenen Beispielen vergleichen wir irgendwie die Gruppenmittelwerte. Und obwohl es sicherlich engere Ansätze zum Vergleichen von Gruppenmitteln gibt, habe ich versucht zu veranschaulichen, wie das Vergleichen von Gruppenmitteln auch als Interaktion oder "2D-Effekt" mit einigen Modellspezifikationen, insbesondere mit nominalen Interaktionen, verstanden werden kann. Ich denke, dass das Verständnis dafür hilfreich ist, um kompliziertere Modelle mit Interaktionseffekten zu verstehen. Ich bin zu Link geht dieser artice einmal mehr, nur weil ich denke , es sollte das Lesen für mit Interaktionen arbeiten jedermann verlangt werden (es gibt einen Grund , dieser Artikel hat über 3k mal zitiert worden ).

UPDATE: Angesichts anderer Antworten wurde diese Antwort aktualisiert, um die Idee zu bestreiten, dass dies irgendeine Form nichtlinearer Modellierung erfordert oder dass - angesichts des spezifischen Beispiels von OP für zwei binäre Kovariaten, dh vier Gruppen - eine vorhanden sein muss Vorzeichenwechsel, um dies nicht parametrisch zu beurteilen. Wenn das Alter beispielsweise kontinuierlich wäre, gäbe es andere Möglichkeiten, um dieses Problem anzugehen, aber dies war nicht das Beispiel von OP.

5ayat
quelle
Sie verwenden nicht die Struktur zweier gekreuzter Faktoren. Sie vergleichen lediglich vier Gruppen. Bei Dunns Test geht es überhaupt nicht um Interaktion.
Horst Grünbusch
Einverstanden, Dunns Test handelt nicht von Interaktion. Die Frage fragt jedoch speziell nach einer Interaktion zwischen zwei binären Variablen. Meine Antwort zeigt, wie dies dem Vergleich der vier Gruppen entspricht. Wenn Interaktionsbegriffe für OP neu sind, ist dies hoffentlich eine hilfreiche Illustration.
5ayat
1

Sie haben also diese Zufallsvariablen:

  • A - nimmt Werte in . Das nennen wir Alter .N
  • S - nimmt Werte in . Das nennen wir Sex .{male,female}
  • W - nimmt Werte in . Das nennen wir Gewicht .]0,[

Und Sie haben diese Wahrscheinlichkeitsmassen- / Dichtefunktionen:

  • fW - Dichte von rv .W
  • fW,A - gemeinsame Dichte von rv .W,A
  • fW,S - gemeinsame Dichte von rv von .W,S
  • fW,A,S - gemeinsame Dichte von rv .W,A,S

Sie wissen , dass es existiert Gewicht , Alter und Geschlecht , so dass:was

  • fW,A(w,a)fW(w) , daher ist das Gewicht nicht unabhängig vom Alter.
  • fW,S(w,s)fW(w) , daher ist das Gewicht nicht unabhängig vom Geschlecht.

Nun möchten Sie herausfinden, ob Alter und Geschlecht unabhängig sind, da sie gemeinsam / kombinatorisch mit dem Gewicht zusammenhängen. Mit anderen Worten, Sie möchten dies finden:

fW,A,S(w,a,s)fW,A(w,a)fW,S(w,s)

Wenn Sie zeigen , dass es Gewicht existiert , Alter und Geschlecht , die die oben erfüllen, dann werden Sie , dass Alter und Geschlecht zeigen , haben eine kombinatorische Wirkung auf das Gewicht.was

Sie kennen jedoch nicht die wahren gemeinsamen PDFs oben. Da Sie sich auf nicht parametrische Methoden beschränken möchten, besteht Ihre Aufgabe nun darin, diese nicht parametrischen Schätzungen zu finden:

  • f^W,A(w,a) .
  • f^W,S(w,s) .
  • f^W,A,S(w,a,s) .

Und dann zeig das:

  • Ihre Dichteschätzungen sind genau genug.
  • Die Wahrscheinlichkeit, dass ist sehr hoch.f^W,A,S(w,a,s)f^W,A(w,a)f^W,S(w,s)
  • Oder dass die Wahrscheinlichkeit, dass ist sehr niedrig.f^W,A,S(w,a,s)=f^W,A(w,a)=f^W,S(w,s)
Höhlenmensch
quelle
0

Das würde nach Interaktionseffekten suchen . Die lineare Modellierung könnte dies überprüfen, ist jedoch nicht nicht parametrisch. Ich denke, es muss ein anderes Werkzeug verwendet werden.

Wie überprüfen Sie Ihre ageund genderWirkung bis jetzt?

EDIT: Diese Antwort scheint Ihnen zu helfen

Riff
quelle