Wie wählt man in einem geplanten Experiment zwischen ANOVA und ANCOVA?

17

Ich führe ein Experiment durch, das Folgendes beinhaltet:

  • DV: Scheibenverbrauch (kontinuierlich oder kategorisch)

  • IV: Gesunde Nachricht, ungesunde Nachricht, keine Nachricht (Kontrolle) (3 Gruppen, denen zufällig Personen zugewiesen werden - kategorisch) Dies ist eine manipulierte Nachricht über die Gesundheit des Slice.

Die folgenden IVs können als individuelle Differenzvariablen betrachtet werden:

  • Impulsivität (dies kann kategorisch sein, dh hoch gegen niedrig oder kontinuierlich und wird anhand einer Skala gemessen)

  • Süße Geschmackspräferenz (dies wird auch anhand eines Fragebogens gemessen, bei dem für jede Frage drei Optionen zur Auswahl stehen)

  • BMI - Teilnehmer werden entsprechend gewogen (dies kann auch als kategorisch oder kontinuierlich angesehen werden).

Da die Gruppen nach dem Zufallsprinzip einer von drei Gruppen zugeordnet werden, gehe ich davon aus, dass ich eine Art ANOVA durchführe und möglicherweise eine faktorielle ANOVA verwende, da ich daran interessiert bin, welche IV die DV am meisten beeinflusst, aber auch die Wechselwirkungen zwischen den IVs, wie Untersuchungen zeigen dass es Beziehungen zwischen einigen Kombinationen gibt.

Ich bin mir jedoch nicht ganz sicher, da ich wissen muss, ob es am besten ist, wenn die IVs alle kategorisch oder kontinuierlich oder gemischt sind.

Oder ist ANCOVA eine Möglichkeit oder sogar eine Regression, aber ich bin mir nicht sicher, ob sie Gruppen zugeordnet und dann anhand ihrer Antworten auf Umfragen kategorisiert werden.

Ich hoffe, dass dies sinnvoll ist, und freue mich darauf, von jemandem über meine Anfrage zu hören.

Mobo
quelle
Hallo Melory, das klingt nach einem interessanten Experiment. Für Ihre IVs, sind daran interessiert , Sie wissen , wie jeder auf die Beziehung steht DVauf einer kontinuierlichen Skala, oder sind Sie mehr Interesse an den Auswirkungen von IVGruppen, zum Beispiel , dass übergewichtige Menschen essen mehr Scheibe als normalgewichtige Menschen (für Ihre BMIMaßnahme)?
Michelle
Hallo Michelle, danke für deine Kommentare. Um ehrlich zu sein, bin ich noch in der Entwicklungsphase und gehe überall hin! Ich habe jedoch ein vorläufiges Ziel: Das Hauptziel der vorliegenden Studie ist die Untersuchung der Auswirkungen lebensmittelbezogener Überzeugungen auf die Gesundheit von Lebensmitteln auf die tatsächliche Nahrungsaufnahme. Ein weiteres Ziel ist es, herauszufinden, inwieweit das Streben nach Empfindung, die Vorliebe für süßen Geschmack und der BMI die Auswirkungen lebensmittelbezogener Überzeugungen auf die Nahrungsaufnahme mindern können. “
Mobo
Hallo, Michelle, füge nur einen Kommentar hinzu. Nachdem ich jedoch gesagt habe, dass ich mich auch für die Wechselwirkungen zwischen einigen IVs interessiere, deutet die Forschung auf Beziehungen hin, dh Menschen, die übergewichtig sind, korrelieren mit der Suche nach Empfindungen. Hilft das, wo ich bin? Es würde mich interessieren, Ihre Gedanken zu hören. Vielen Dank.
Mobo
Hallo Melory, ich würde nicht BMIals kontinuierliches Maß hinzufügen und die Kategorien Untergewicht / Normalgewicht / Übergewicht / Adipositas verwenden, da dies Ihre Forschungsfrage ist, und nicht, ob die Slice-Menge mit zunehmender BMIPunktzahl zunimmt . Ich würde versuchen, die anderen IVs als kontinuierlich. Wirst du veröffentlichen, da ich beruflich an deinem Artikel interessiert wäre?
Michelle
Hallo Michelle, danke dafür. Ich würde gerne veröffentlichen. Interessiert Sie das? Wollen Sie damit sagen, dass es angemessen wäre, eine faktorielle ANOVA durchzuführen? Ich denke, ich habe möglicherweise zu viele Variablen, um damit zu arbeiten.
Mobo

Antworten:

34

In der Geschichte haben sich Regression und ANOVA getrennt entwickelt und werden zum Teil aufgrund der Tradition immer noch oft getrennt unterrichtet. Darüber hinaus wird ANOVA häufig als geeignet für geplante Experimente (dh die Manipulation einer Variablen- / Zufallszuordnung) und Regression als geeignet für Beobachtungsforschung (z. B. Herunterladen von Daten von einer Regierungswebsite und Suchen nach Beziehungen) angesehen. All dies ist jedoch etwas irreführend. Eine ANOVA ist eine Regression, bei der alle Kovariaten kategorisch sind. Eine ANCOVA isteine Regression mit qualitativen und stetigen Kovariaten, jedoch ohne Wechselwirkungsterme zwischen den Faktoren und den stetigen erklärenden Variablen (dh die sogenannte "Annahme paralleler Steigungen"). Ob eine Studie experimentell oder beobachtend ist, hängt nicht mit der Analyse selbst zusammen.

Dein Experiment klingt gut. Ich würde dies als Regression analysieren (in meinen Augen neige ich dazu, alles als Regression zu bezeichnen). Ich würde alle Kovariaten einbeziehen, wenn Sie an ihnen interessiert sind und / oder wenn die Theorien, mit denen Sie arbeiten, darauf hindeuten, dass sie wichtig sein könnten. Wenn Sie der Meinung sind, dass die Wirkung einiger Variablen von anderen Variablen abhängt, müssen Sie alle erforderlichen Interaktionsbegriffe hinzufügen. Beachten Sie, dass jede erklärende Variable (einschließlich der Interaktionsbegriffe!) Einen gewissen Freiheitsgrad beansprucht. Stellen Sie daher sicher, dass Ihre Stichprobengröße angemessen ist. Ich würde keine Ihrer stetigen Variablen dichotomisieren oder auf andere Weise kategorisieren (es ist bedauerlich, dass diese Praxis weit verbreitet ist, es ist wirklich eine schlechte Sache). Ansonsten hört es sich so an, als ob Sie auf dem Weg sind.

Update: Hier scheint es Bedenken zu geben, ob kontinuierliche Variablen in Variablen mit nur zwei (oder mehr) Kategorien konvertiert werden sollen. Lassen Sie mich das hier und nicht in einem Kommentar ansprechen. Ich würde alle Ihre Variablen als kontinuierlich halten. Es gibt mehrere Gründe, um die Kategorisierung kontinuierlicher Variablen zu vermeiden:

  1. Durch Kategorisieren würden Sie Informationen wegwerfen - einige Beobachtungen sind weiter von der Trennlinie entfernt und andere sind näher dran, aber sie werden so behandelt, als wären sie gleich. In der Wissenschaft ist es unser Ziel, mehr und bessere Informationen zu sammeln und diese Informationen besser zu organisieren und zu integrieren. Informationen wegzuwerfen widerspricht meiner Meinung nach einfach der guten Wissenschaft;
  2. Sie neigen dazu, die statistische Leistung zu verlieren, wie @Florian betont (danke für den Link!);
  3. Sie verlieren die Fähigkeit, nichtlineare Beziehungen zu erkennen, wie @ rolando2 hervorhebt.
  4. Was ist, wenn jemand Ihre Arbeit liest und sich fragt, was passieren würde, wenn wir die Linie B / T-Kategorien an einer anderen Stelle zeichnen würden? (Betrachten Sie zum Beispiel Ihr BMI-Beispiel: Was wäre, wenn jemand in 10 Jahren, basierend auf dem aktuellen Stand der Literatur, auch über untergewichtige und krankhaft fettleibige Menschen Bescheid wissen möchte?) Pech gehabt, aber wenn Sie alles in seiner ursprünglichen Form behalten, kann jeder Leser sein eigenes bevorzugtes Kategorisierungsschema bewerten.
  5. In der Natur gibt es selten „helle Linien“. Wenn Sie also eine Kategorisierung vornehmen, können Sie die untersuchte Situation nicht so wiedergeben, wie sie wirklich ist. Wenn Sie befürchten, dass es aus a priori theoretischen Gründen zu einem bestimmten Zeitpunkt tatsächlich eine helle Linie gibt, können Sie einen Spline einsetzen, um dies zu bewerten. Stellen Sie sich eine Variable vor, , die von 0 bis 1 reicht, und Sie denken, die Beziehung zwischen dieser Variablen und einer Antwortvariablen ändert sich plötzlich und grundlegend bei 0,7. Dann erstellen Sie eine neue Variable (Spline genannt) wie folgt: dann Fügen Sie diese neue -Variable zusätzlich zu Ihrem ursprünglichen zu Ihrem Modell hinzuX
    Xsplichne=0wenn X.7Xsplichne=X-.7wenn X>.7
    XsplichneXVariable. Die Modellausgabe weist bei 0,7 einen scharfen Bruch auf, und Sie können beurteilen, ob dies unser Verständnis der Daten verbessert.

1 & 5 sind meiner Meinung nach die wichtigsten.

gung - Wiedereinsetzung von Monica
quelle
Hallo Gung. Vielen Dank für Ihre Kommentare. Sie würden also die Regression verwenden und dann keine der IVs als kategorisch haben? Ich dachte, dass der BMI entweder übergewichtig / fettleibig oder normal sein könnte. Die Geschmackspräferenz hat Kategorien und auch für die Sensationssuche kann sie kategorisch sein, da es sich um wahr / falsch-Aussagen handelt, die dann eine Punktzahl ergeben, die dann kategorisiert werden kann. Aber sehen Sie sie als wirklich kontinuierlich an?
Mobo
Hi again gung, dies ist mein vorläufiges Ziel, das auch Klarheit schaffen kann: Das Hauptziel der aktuellen Studie ist es, die Auswirkungen von lebensmittelbezogenen Überzeugungen über die Gesundheit von Lebensmitteln auf die tatsächliche Nahrungsaufnahme zu untersuchen. Darüber hinaus besteht ein sekundäres Ziel darin, herauszufinden, inwieweit Empfindungssucht, Vorliebe für süßen Geschmack und BMI die Auswirkungen lebensmittelbezogener Überzeugungen auf die Nahrungsaufnahme mindern können. Es würde mich interessieren, Ihre Gedanken zu hören.
Mobo
Schöne Antwort von @gung. Ich gehe davon aus, dass Sie Ihre stetigen Variablen im Idealfall so beibehalten, wie sie sind, da dies Ihnen die meisten Informationen liefern würde. Viele Menschen finden es entmutigend zu lernen, wie man sowohl kontinuierliche als auch kategoriale Prädiktoren einbezieht, aber es kann sich als lohnenswert erweisen, entweder für diese Studie oder für eine zukünftige. Und unabhängig davon, ob Sie sie kategorisieren oder nicht, sollten Sie nach Wegen suchen, um eventuell vorhandene nichtlineare Beziehungen aufzudecken - möglicherweise U-förmig, auf dem Kopf stehend, U-förmig, J-förmig oder umgekehrt-J. Dies könnte Ihr Studium erheblich bereichern.
Rolando2
Ja +1 für Gungs Antwort! Die Dichotomisierung stetiger Variablen ist beispielsweise wegen eines Stromausfalls nie eine gute Idee (z. B. der berühmte Artikel von Jacob Cohen unc.edu/~rcm/psy282/cohen.1983.pdf ). Um Ihre "Nachricht" IV in einer Regressionsanalyse zu behandeln, empfehle ich, Kontrastcodes zu verwenden, um deren Wirkung (und Interaktionen mit dieser IV) zu testen, siehe zum Beispiel Judd, CM, & McClelland, GH, Ryan, C. (2008) ). Datenanalyse: Ein Modellvergleichsansatz (2. Aufl.). New York: Routledge Press.
Florian
Hallo rolando2, vielen Dank für dein Feedback. Sie haben Recht, denn es fällt mir schwer, möglicherweise sowohl kategoriale als auch kontinuierliche Variablen zu kombinieren, was es mir schwer macht, die zu verwendende Analyse zu bestimmen. Mein vorläufiges Ziel ist: Das Hauptziel der vorliegenden Studie ist es, die Auswirkungen lebensmittelbezogener Überzeugungen auf die Gesundheit von Lebensmitteln auf die tatsächliche Nahrungsaufnahme zu untersuchen. Ein weiteres Ziel ist es, herauszufinden, inwieweit das Streben nach Empfindung, die Vorliebe für süßen Geschmack und der BMI die Auswirkungen lebensmittelbezogener Überzeugungen auf die Nahrungsaufnahme mindern können. “ Gedanken dazu?
Mobo