Ich habe das ez-Paket für R entwickelt, um den Leuten den Übergang von Statistikpaketen wie SPSS zu R zu erleichtern. Dies wird (hoffentlich) dadurch erreicht, dass die Spezifikation verschiedener ANOVA-Aromen vereinfacht wird und eine SPSS-ähnliche Ausgabe (einschließlich Effektgrößen und -annahmen) bereitgestellt wird Tests), unter anderem. Die ezANOVA()
Funktion dient hauptsächlich als Wrapper für car::Anova()
, die aktuelle Version ezANOVA()
implementiert jedoch nur Quadratsummen car::Anova()
vom Typ II , während die Angabe von Quadratsummen vom Typ II oder -III zulässig ist. Wie ich möglicherweise hätte erwarten sollen, haben mehrere Benutzer darum gebeten, dass ich ein Argument vorbringeezANOVA()
Damit kann der Benutzer Typ II oder Typ III anfordern. Ich habe mich zurückgehalten, dies zu tun und meine Argumentation im Folgenden zu skizzieren, aber ich würde es begrüßen, wenn die Community sich zu meiner oder einer anderen Argumentation äußern würde, die sich auf das Thema bezieht.
Gründe für die nicht ein „SS_type“ Argument einschließlich ezANOVA()
:
- Der Unterschied zwischen den Summenquadraten Typ I, II und III tritt nur auf, wenn die Daten nicht ausgeglichen sind. In diesem Fall würde ich sagen, dass die Verbesserung des Ungleichgewichts durch weitere Datenerfassung mehr Vorteile bringt als das Herumspielen mit der ANOVA-Berechnung.
- Der Unterschied zwischen Typ II und III gilt für Effekte niedrigerer Ordnung, die durch Effekte höherer Ordnung qualifiziert sind. In diesem Fall halte ich die Effekte niedrigerer Ordnung für wissenschaftlich uninteressant. (Siehe unten für mögliche Komplikationen des Arguments.)
- Für die seltenen Fälle, in denen (1) und (2) nicht zutreffen (wenn eine weitere Datenerfassung unmöglich ist und der Forscher ein berechtigtes wissenschaftliches Interesse an einem qualifizierten Haupteffekt hat, den ich mir derzeit nicht vorstellen kann), kann man relativ leicht Änderungen vornehmen die
ezANOVA()
Quelle oder beschäftigencar::Anova()
sich, um Typ-III-Tests zu erreichen. Auf diese Weise sehe ich den zusätzlichen Aufwand, der erforderlich ist, um Typ-III-Tests zu erhalten, als ein Mittel, mit dem ich sicherstellen kann, dass nur diejenigen diesen Weg gehen, die wirklich wissen, was sie tun.
Der jüngste Antragsteller vom Typ III wies darauf hin, dass Argument (2) durch die Berücksichtigung der Umstände untergraben wird, unter denen vorhandene, aber "nicht signifikante" Effekte höherer Ordnung die Berechnung von Quadratsummen für Effekte niedrigerer Ordnung beeinflussen können. In solchen Fällen ist es vorstellbar, dass ein Forscher auf den Effekt höherer Ordnung blickt und erkennt, dass er "nicht signifikant" ist, und versucht, die Effekte niedrigerer Ordnung zu interpretieren, die, ohne dass der Forscher es weiß, beeinträchtigt wurden. Meine erste Reaktion ist, dass dies kein Problem mit Quadratsummen ist, sondern mit p-Werten und der Tradition des Nullhypothesentests. Ich vermute, dass ein expliziteres Maß für die Evidenz, wie das Wahrscheinlichkeitsverhältnis, mit größerer Wahrscheinlichkeit ein weniger zweideutiges Bild der unterstützten Modelle ergibt, das mit den Daten übereinstimmt. Ich habe jedoch keine
quelle
Antworten:
Nur zur Verdeutlichung - ich glaube, ich bin der jüngste Antragsteller.
Spezifischer Kommentar zu Mikes Punkten:
Es ist klar, dass der I / II / III-Unterschied nur für korrelierte Prädiktoren gilt (von denen unausgeglichene Konstruktionen das häufigste Beispiel sind, sicherlich in der faktoriellen ANOVA) - aber dies scheint mir ein Argument zu sein, das die Analyse der unausgeglichenen Situation zunichte macht (und damit jede Debatte vom Typ I / II / III). Es mag unvollkommen sein, aber so geschehen die Dinge (und in vielen Zusammenhängen überwiegen die Kosten für die weitere Datenerfassung trotz aller Einschränkungen das statistische Problem).
Dies ist völlig fair und repräsentiert das Fleisch der meisten Argumente für "II versus III", denen ich begegnet bin. Die beste Zusammenfassung, auf die ich gestoßen bin, ist Langsrud (2003) "ANOVA für unausgeglichene Daten: Verwenden Sie Typ II anstelle von Typ III-Quadratsummen", Statistics and Computing 13: 163-167 (Ich habe ein PDF, wenn das Original schwer zu finden ist ). Er argumentiert (am Beispiel des Zweifaktor-Falls), dass es bei einer Wechselwirkung eine Wechselwirkung gibt, sodass die Berücksichtigung von Haupteffekten normalerweise bedeutungslos ist (ein offensichtlich fairer Punkt) - und wenn es keine Wechselwirkung gibt, die Typ-II-Analyse von Die Haupteffekte sind (zweifellos) leistungsstärker als beim Typ III, daher sollten Sie sich immer für Typ II entscheiden. Ich habe andere Argumente gesehen (zB Venables,
Und ich stimme dem zu: Wenn Sie eine Interaktion haben, aber auch eine Frage zum Haupteffekt haben, dann sind Sie wahrscheinlich auf dem Gebiet der Heimwerker.
Es ist klar, dass es diejenigen gibt, die nur Typ III wollen, weil SPSS dies tut, oder einen anderen Verweis auf die statistische Höhere Behörde. Ich bin nicht ganz gegen diese Ansicht, wenn es darauf ankommt, dass eine Menge Leute an SPSS festhalten (gegen die ich einige Dinge habe, nämlich Zeit, Geld und Lizenzablaufbedingungen) und Typ III SS oder eine Menge Leute, die zu R und Typ III SS wechseln. Allerdings ist dieses Argument statistisch eindeutig lahm.
Das Argument, das ich für Typ III als wesentlich aussagekräftiger empfand, stammt jedoch von Myers & Well (2003, "Research Design and Statistical Analysis", S. 323, 626-629) und Maxwell & Delaney (2004, " Experimente entwerfen und Daten analysieren: Eine Modellvergleichsperspektive ", S. 324-328, 332-335). Das ist wie folgt:
Meine Interpretation (und ich bin kein Experte!) Ist, dass es auf beiden Seiten des Arguments eine Menge höherer statistischer Stellen gibt. Die üblichen Argumente beziehen sich nicht auf die übliche Situation, die zu Problemen führen würde (diese Situation ist die häufigste bei der Interpretation von Haupteffekten mit einer nicht signifikanten Wechselwirkung). und dass es in dieser Situation gute Gründe gibt, über den Typ-II-Ansatz besorgt zu sein (und es kommt auf eine Sache an, bei der Macht gegen potentiellen Überliberalismus ankommt).
Für mich ist das genug, um mir sowohl die Option Typ III in ezANOVA als auch Typ II zu wünschen, da dies (für mein Geld) eine hervorragende Schnittstelle zu den ANOVA-Systemen von R ist. R ist meiner Ansicht nach nicht einfach für Anfänger zu verwenden, und das "ez" -Paket mit ezANOVA und den hübschen Effekt-Plot-Funktionen trägt wesentlich dazu bei, R einem allgemeineren Forschungspublikum zugänglich zu machen. Einige meiner Gedanken (und ein böser Hack für ezANOVA) sind unter http://www.psychol.cam.ac.uk/statistics/R/anova.html zu finden .
Würde mich interessieren, alle Gedanken zu hören!
quelle
Vorsichtsmaßnahme: eine rein nicht statistische Antwort. Ich bevorzuge es, mit einer Funktion (oder mindestens einem Paket) zu arbeiten, wenn ich dieselbe Art von Analyse durchführe (z. B. ANOVA). Bisher verwende ich konsequent,
Anova()
da ich die Syntax für die Angabe von Modellen mit wiederholten Kennzahlen bevorzuge -aov()
und bei nicht wiederholten Kennzahlen wenig (SS-Typ I) verliere.ezANOVA()
ist gut für den zusätzlichen Nutzen von Effektgrößen. Was ich aber nicht besonders mag, ist, dass ich mich mit 3 verschiedenen Funktionen befassen muss, um im Wesentlichen dieselbe Art von Analyse durchzuführen, nur weil eine von ihnen das Merkmal X (aber nicht Y) und die andere das Merkmal Y (aber nicht X) implementiert.Für ANOVA, kann ich wählen zwischen
oneway()
,lm()
,aov()
,Anova()
,ezANOVA()
, und wahrscheinlich noch andere. Wenn man R unterrichtet, ist es schon schwierig, die verschiedenen Optionen zu erklären, wie sie sich zueinander verhalten (aov()
ist ein Wrapper fürlm()
) und welche Funktion was tut:oneway()
Nur für Einzelfaktorausführungen, jedoch mit Optionvar.equal=FALSE
. Keine solche Option inaov()
und andere, aber diese Funktionen auch für multifaktorielle Designs.aov()
, besser inAnova()
aov()
, nicht inAnova()
Anova()
, nicht inaov()
ezANOVA()
, nicht in anderenEs wäre ordentlich, nur eine Funktion mit einer konsistenten Syntax zu unterrichten, die alles macht. Ohne die praktische SS Typ III
ezANOVA()
kann diese Funktion für mich nicht funktionieren, da ich weiß, dass die Schüler gebeten werden, sie irgendwann zu verwenden ("überprüfen Sie einfach die Ergebnisse, die John Doe mit SPSS erhalten hat"). Ich denke, es ist besser, die Option zu haben, die Wahl selbst zu treffen, ohne noch eine andere Syntax für die Spezifikation von Modellen lernen zu müssen. Die Einstellung "Ich weiß, was am besten für Sie ist" mag ihre Vorzüge haben, kann aber übermäßig beschützend sein.quelle
multcomp
Pakets (das, soweit ich mich erinnere,aov
Objekte erfordert ). Ansonsten stimme ich voll und ganz zu und nutze es normalerweiseez
für meinen täglichen Dienst, weil es so einfach ist ...aov
Element zurückzugeben, das großartig wäre. Bisher bin ich in der Regel zu faul, um mein eigenesaov
Element zu machen und SieezANOVA
stattdessen mit t.tests zu verwenden ...ez
Paket hat ein großes Potenzial: In der Psychologie wird es bereits sehr oft empfohlen (vgl. Buch "R für Einsteiger" von Luhmann). Eine noch flexiblere Gestaltung wäre sicherlich wünschenswert.Die R-Welt mag Typ 3 SS nicht zu sehr.
Eine der meist zitierten Literaturstellen sind die "Exegeses on Linear Models" von Bill Venables (2000) .
Ich hoffe, dass ich ihn nicht verarsche, aber ich denke, sein Hauptargument ist, dass Typ 3 SS das Marginalitätsprinzip linearer Modelle verletzt und daher nicht vernünftig ist.
quelle
Dies war für mich eine aufschlussreiche Debatte zum Thema Typ II / III. Vielen Dank für die Mühe, die Diskussion zu führen. Ich kam zu der Ansicht, Typ II konsequent gegenüber Typ III zu befördern, hatte aber ein schwaches Verständnis für das Argument - ich habe mich nur auf die Ratschläge in John Fox 'Regressionsbuch (Auto) verlassen, denen zufolge Typ III-Tests selten sind interpretierbar (naja, ich denke er hat das gesagt ...).
Wie auch immer, ezANOVA ist wirklich nützlich, um den Zugriff auf R-Funktionen zu ermöglichen, die ansonsten für Studenten, die ich in Psychologie unterrichte, unmöglich wären. Ich biete Online-R-Module an, von denen eines mit ezANOVA ausgestattet ist, um gemischte ANOVA-Designs zu demonstrieren.
Probieren Sie es hier aus:
http://www.wessa.net/rwasp_Mixed%20Model%20ANOVA.wasp
Nachdem das Modul geladen wurde (~ 10s), finden Sie die Berechnungsschaltfläche (auf halber Seite) und es wird ezANOVA und die zugehörigen Tabellen und Diagramme ausgeführt.
Ian
quelle