Ich habe zwei kategoriale / nominale Variablen. Jeder von ihnen kann nur zwei unterschiedliche Werte annehmen (also habe ich insgesamt 4 Kombinationen).
Jede Wertekombination enthält eine Reihe numerischer Werte. Ich habe also 4 Sätze von Zahlen. Um es konkreter zu machen, nehmen wir an, ich habe male / female
und young / old
als nominelle Variablen und ich habe weight
als abhängige numerische "Ausgabe".
Ich weiß, dass der Übergang von male
zu female
das Durchschnittsgewicht verändert und diese Veränderungen statistisch signifikant sind. So kann ich einen gender
Faktor berechnen . Gleiches gilt für die age
Variable. Ich weiß, dass der Übergang von young
zu old
das Durchschnittsgewicht ändert und ich kann den entsprechenden age
Faktor berechnen .
Was ich nun wirklich sehen möchte, wenn die Daten beweisen, dass der Übergang von jungen Frauen zu alten Männern eher eine Kombination aus Geschlechts- und Altersfaktoren ist. Mit anderen Worten, ich möchte wissen, ob Daten belegen, dass es "2D-Effekte" gibt, oder mit anderen Worten, dass Alters- und Geschlechtseffekte nicht unabhängig voneinander sind. Zum Beispiel könnte es sein, dass das Älterwerden bei Männern das Gewicht um den Faktor 1,3 erhöht und bei Frauen der entsprechende Faktor 1,1 beträgt.
Natürlich kann ich die beiden genannten Faktoren berechnen (Altersfaktor für Männer und Altersfaktor für Frauen) und sie sind unterschiedlich. Aber ich möchte die statistische Signifikanz dieses Unterschieds berechnen. Wie real ist dieser Unterschied?
Wenn möglich, möchte ich einen nicht parametrischen Test durchführen. Ist es möglich, das zu tun, was ich tun möchte, indem ich die vier Sätze mische, sie mische, neu aufteile und etwas berechne?
Antworten:
Es gibt nichtparametrische Interaktionstests. Grob gesagt ersetzen Sie die beobachteten Gewichte durch ihre Ränge und behandeln den resultierenden Datensatz als heteroskedastische ANOVA. Schauen Sie sich zB "Nichtparametrische Methoden in Fakultätsentwürfen" von Brunner und Puri (2001) an.
Die Art der nichtparametrischen Interaktion, an der Sie interessiert sind, kann in dieser Allgemeinheit jedoch nicht gezeigt werden. Du sagtest:
Letzteres ist unmöglich. Nichtparametrische Wechselwirkungen müssen einen Vorzeichenwechsel beinhalten, dh das Älterwerden erhöht das Gewicht der Männer, verringert jedoch das Gewicht der Frauen. Ein solcher Vorzeichenwechsel bleibt auch dann bestehen, wenn Sie die Gewichte monoton transformieren. Sie können jedoch eine monotone Transformation für die Daten auswählen, die die Gewichtszunahme um den Faktor 1,1 so nahe wie möglich an 1,3 abbildet. Natürlich werden Sie niemals einen signifikanten Unterschied zeigen, wenn er so nah sein kann, wie Sie möchten.
Wenn Sie wirklich an Interaktionen ohne Vorzeichenwechsel interessiert sind, sollten Sie sich an die übliche parametrische Analyse halten. Dort sind monotone Transformationen, die "den Unterschied schlucken", nicht erlaubt. Dies sollten Sie natürlich auch bei der Modellierung und Interpretation Ihrer Statistiken berücksichtigen.
quelle
Wenn Sie der Meinung sind, dass die Auswirkungen von Alter und Geschlecht mehr als nur die individuellen Auswirkungen sind, können Sie das ModellDer Koeffizient erfasst die Größe des "2D" -Effekts von Alter und Geschlecht. Sie können die t-Statistik von überprüfen , um eine ungefähre Vorstellung davon zu erhalten, ob sich das in Ihrem Modell beobachtete erheblich von .γ γ γ γ = 0w e i gh tich= α ⋅ a geich+ β⋅ ge n de rich+ γ⋅ ( ge n de rich⋅ a geich) . γ γ γ γ=0
Hier ist ein sehr grobes grafisches Beispiel, um zu zeigen, was dieser zusätzliche multiplikative Begriff bewirkt.genderi⋅agei
In der Modellantwort versuchen wir im Wesentlichen, eine einfache Hyperebene an die Daten anzupassenresponse=x1+x2
Dieses Modell ist in den Kovariaten linear, daher die lineare Form, die Sie im obigen Diagramm sehen.
Andererseits ist die Modellantwort in und nicht linear und ermöglicht daher ein gewisses Maß an Krümmungresponse=x1+x2+x1⋅x2 x1 x2
Wenn Sie die Hypothese, dass ist, nicht ablehnen, bedeutet dies, dass Sie nicht ablehnen, dass das Modell eine gewisse Krümmung dieser Form aufweist.γ=0
In Bezug auf einen nicht parametrischen Test können Sie etwas in der Art tun, wie Sie es vorgeschlagen haben, indem Sie Bootstrap-Standardfehler für . Dies bedeutet, dass Sie mehrmals: 1) Ihre Daten durch Ersetzen abtasten, 2) den linearen Modus neu berechnen, 3) eine Schätzung . Nachdem Sie viele Schätzungen für , können Sie das -Quantil verwenden, um ein nicht parametrisches -Konfidenzintervall für einzurichten . Weitere Informationen hierzu finden Sie in Google unter "Bootstrap-Standardfehler".γ γ^ γ^ 50±p% 2p% γ
quelle
Wie andere angemerkt haben, kann dies linear mit einer Interaktion modelliert werden. Sie interagieren mit zwei Dummies, und daran ist nichts Nichtlineares. In Anbetracht des Modells: Der marginale Effekt 'gender' ist die partielle Ableitung:
Sehen Sie, wie wir, wenn Geschlecht und Alter nur Werte von 0 oder 1 annehmen können, im Wesentlichen nur einen Mittelwertunterschied für vier verschiedene Gruppen betrachten? Das heißt, wir haben nur die vier verschiedenen Kombinationen, die wir in die obigen Gleichungen einfügen können: (1) und , (2) und , (3) und und (4) und . Ihr spezifisches Beispiel entspricht also einem Vergleich zwischen vier Gruppenmitteln.gender=0 age=0 gender=1 age=1 gender=0 age=1 gender=1 age=0
Es kann auch hilfreich sein, diese Diskussion zu sehen, um zu verstehen, wie das oben Gesagte ANOVA mit zwei interagierten nominalen Variablen entspricht. Als weitere Möglichkeit, die Tatsache zu wiederholen, dass wir mit Ihrem spezifischen Beispiel (auch hier gibt es nur vier mögliche Kombinationen von Alter und Geschlecht) auch ein Modell wie das folgende ohne expliziten Interaktionsbegriff angeben könnten:
Wenn als Referenzkategorie weggelassen wird und beispielsweise der Koeffizient ein zwischen und . Wo der Schnitt wird auch durchschnittliche gleich innerhalb (wiederum die Referenzkategorie).old.female b1 old.female young.male α wt old.female
Probieren Sie es mit Ihren eigenen Daten aus. Mit einem linearen Modell mit einer Interaktion, einer ANOVA mit einer Interaktion oder der Verwendung von Dummies für jede der Gruppen ohne Interaktion erhalten Sie dieselben Ergebnisse. Ziemlich cool, oder? Ein Statistikbuch könnte jede dieser Methoden in einem anderen Kapitel aber alle Wege führen nach Rom. Zu sehen, wie dies mit Ihren eigenen Daten funktioniert, ist eine der besten Möglichkeiten, dies zu lernen.…
Die obigen Beispiele sind daher ein zu komplizierter Weg, um zu dieser Schlussfolgerung zu gelangen (dass wir wirklich nur vier Gruppenmittelwerte vergleichen), aber um zu lernen, wie Interaktionen funktionieren, halte ich dies für eine hilfreiche Übung. Es gibt andere sehr gute Beiträge im Lebenslauf über die Interaktion einer kontinuierlichen Variablen mit einer nominalen Variablen oder die Interaktion zweier kontinuierlicher Variablen. Obwohl Ihre Frage bearbeitet wurde, um nichtparametrische Tests zu spezifizieren, halte ich es für hilfreich, Ihr Problem anhand eines konventionelleren (dh parametrischen) Ansatzes zu betrachten, da die meisten nichtparametrischen Ansätze für Hypothesentests dieselbe Logik haben, aber im Allgemeinen mit weniger Annahmen über bestimmte Verteilungen.
Die Frage stellte sich jedoch speziell nach einem nichtparametrischen Ansatz, der beispielsweise angemessener sein könnte, wenn wir bestimmte Annahmen über die Normalität von nicht treffen wollten . Ein geeigneter nichtparametrischer Test wäre Dunns Test . Dieser Test ähnelt dem Wilcoxon-Mann-Whitney-Rang-Summen-Test, weist jedoch mehr als zwei Kategorien auf.wt
Andere Permutationstests können ebenfalls geeignet sein, wenn Sie einen bestimmten Unterschied in den Mitteln hatten, mit denen Sie beispielsweise gegen . Unabhängig davon, ob Sie R verwenden oder nicht, bietet die Dokumentation des Münzpakets eine gute Zusammenfassung verschiedener nichtparametrischer Tests und unter welchen Umständen diese Tests angemessen sein könnten.old.men young.women
Kurz neben "signifikanten" Interaktionen
Manchmal sehen Sie Aussagen wie "Die Interaktion zwischen und war statistisch signifikant." Solche Aussagen sind nicht unbedingt falsch, aber irreführend. Wenn ein Autor dies schreibt, sagt er normalerweise, dass der Koeffizient für den Interaktionsterm statistisch signifikant war. Dies ist jedoch ein bedingungsloser Effekt in einem bedingten Modell. Ein genauerer Bericht würde sagen, dass " über 'einige Werte' von statistisch signifikant war", wobei alle anderen Kovariaten auf einem vernünftigen Wert wie einem Mittelwert, Median oder Modus konstant gehalten wurden.x1 x2 x1 x2 Wenn wir jedoch nur zwei Kovariaten haben, die nur Werte von 0 oder 1 annehmen können, bedeutet dies, dass wir im Wesentlichen vier Gruppenmittelwerte betrachten.
Gearbeitetes Beispiel
Vergleichen wir die Ergebnisse des Interaktionsmodells mit den Ergebnissen des Dunn-Tests. Lassen Sie uns zunächst einige Daten generieren, bei denen (a) Männer mehr wiegen als Frauen, (b) jüngere Männer weniger wiegen als ältere Männer und (c) es keinen Unterschied zwischen jüngeren und älteren Frauen gibt.
Schätzen Sie das Interaktionsmodell und erhalten Sie das vorhergesagte aus dem Randeffekt (Paket mit den Effekten). Sehen Sie hier , warum wir wollen nicht die bedingungslosen Effekte in einem Modell wie folgt zu interpretieren. Stattdessen wollen wir marginale Effekte interpretieren. Das Modell erkennt die Unterschiede, die wir bei der Generierung unserer Beispieldaten auferlegt haben, anständig.wt
Müssen Sie einen Standardfehler oder ein Konfidenzintervall für Ihren Randeffekt berechnen? Das oben erwähnte "Effekt" -Paket kann dies für Sie tun, aber noch besser, Aiken und West (1991) geben Ihnen die Formeln, selbst für viel kompliziertere Interaktionsmodelle. Ihre Tabellen sind bequem gedruckt hier , zusammen mit sehr guten Kommentar von Matt Golder.
Nun, um Dunns Test zu implementieren.
Der p-Wert des Kruskal-Wallis-Chi-Quadrat-Testergebnisses legt nahe, dass mindestens eine unserer Gruppen "aus einer anderen Population stammt". Bei den gruppenweisen Vergleichen ist die obere Zahl Dunns Z-Test-Statistik und die untere Zahl ein p-Wert, der für mehrere Vergleiche angepasst wurde. Da unsere Beispieldaten eher künstlich waren, ist es nicht überraschend, dass wir so viele kleine p-Werte haben. Beachten Sie jedoch den Vergleich unten rechts zwischen jüngeren und älteren Frauen. Der Test unterstützt korrekt die Nullhypothese, dass zwischen diesen beiden Gruppen kein Unterschied besteht.
Sowohl das Interaktionsmodell als auch Dunns Test führen uns zu ähnlichen Schlussfolgerungen. In allen oben angegebenen Beispielen vergleichen wir irgendwie die Gruppenmittelwerte. Und obwohl es sicherlich engere Ansätze zum Vergleichen von Gruppenmitteln gibt, habe ich versucht zu veranschaulichen, wie das Vergleichen von Gruppenmitteln auch als Interaktion oder "2D-Effekt" mit einigen Modellspezifikationen, insbesondere mit nominalen Interaktionen, verstanden werden kann. Ich denke, dass das Verständnis dafür hilfreich ist, um kompliziertere Modelle mit Interaktionseffekten zu verstehen. Ich bin zu Link geht dieser artice einmal mehr, nur weil ich denke , es sollte das Lesen für mit Interaktionen arbeiten jedermann verlangt werden (es gibt einen Grund , dieser Artikel hat über 3k mal zitiert worden ).…
UPDATE: Angesichts anderer Antworten wurde diese Antwort aktualisiert, um die Idee zu bestreiten, dass dies irgendeine Form nichtlinearer Modellierung erfordert oder dass - angesichts des spezifischen Beispiels von OP für zwei binäre Kovariaten, dh vier Gruppen - eine vorhanden sein muss Vorzeichenwechsel, um dies nicht parametrisch zu beurteilen. Wenn das Alter beispielsweise kontinuierlich wäre, gäbe es andere Möglichkeiten, um dieses Problem anzugehen, aber dies war nicht das Beispiel von OP.
quelle
Sie haben also diese Zufallsvariablen:
Und Sie haben diese Wahrscheinlichkeitsmassen- / Dichtefunktionen:
Sie wissen , dass es existiert Gewicht , Alter und Geschlecht , so dass:w a s
Nun möchten Sie herausfinden, ob Alter und Geschlecht unabhängig sind, da sie gemeinsam / kombinatorisch mit dem Gewicht zusammenhängen. Mit anderen Worten, Sie möchten dies finden:
Wenn Sie zeigen , dass es Gewicht existiert , Alter und Geschlecht , die die oben erfüllen, dann werden Sie , dass Alter und Geschlecht zeigen , haben eine kombinatorische Wirkung auf das Gewicht.w a s
Sie kennen jedoch nicht die wahren gemeinsamen PDFs oben. Da Sie sich auf nicht parametrische Methoden beschränken möchten, besteht Ihre Aufgabe nun darin, diese nicht parametrischen Schätzungen zu finden:
Und dann zeig das:
quelle
Das würde nach Interaktionseffekten suchen . Die lineare Modellierung könnte dies überprüfen, ist jedoch nicht nicht parametrisch. Ich denke, es muss ein anderes Werkzeug verwendet werden.
Wie überprüfen Sie Ihre
age
undgender
Wirkung bis jetzt?EDIT: Diese Antwort scheint Ihnen zu helfen
quelle