Was ist ein Block im experimentellen Design?

20

Ich habe zwei Fragen zum Blockbegriff in der Versuchsplanung: (1) Was ist der Unterschied zwischen einem Block und einem Faktor? (2) Ich habe versucht, einige Bücher zu lesen, aber etwas ist nicht klar: Es scheint, dass die Autoren immer davon ausgehen, dass es keine Wechselwirkung zwischen dem "Blockfaktor" und anderen Faktoren gibt. Stimmt das und wenn ja, warum?

Stéphane Laurent
quelle

Antworten:

13
  1. Der Block ist ein Faktor. Das Hauptziel des Blockierens ist es, die unerklärliche Variation eines Entwurfs im Vergleich zu einem nicht blockierten Entwurf zu reduzieren. Der Block-Effekt an sich interessiert uns nicht , sondern wir blockieren, wenn wir den Verdacht haben, dass das Hintergrundrauschen den Effekt des tatsächlichen Faktors beeinträchtigen würde. Wir gruppieren experimentelle Einheiten in "homogene" Blöcke, in denen alle Ebenen des Hauptfaktors gleichermaßen vertreten sind. Die Varianzanalyse eines randomisierten Steuerblockdesigns teilt die Restlaufzeit eines äquivalenten Einzelfaktors Complete Randomized Design in Block- und Restkomponenten auf. Es ist jedoch zu beachten, dass die letztere Komponente weniger Freiheitsgrade als bei Einzelfaktor-CR-Konstruktionen aufweist, was zu höheren Schätzungen für führt(SSResichdueinl)
    MSResichdueinl=SSResichdueinl/d.f. .
    Die Entscheidung, ob gesperrt oder nicht gesperrt wird, sollte getroffen werden, wenn wir davon ausgehen, dass die Abnahme der Residuen die Abnahme von df mehr als kompensieren wird

  2. In der Regel wird RCB-Designdaten ein additives Modell zugeordnet, bei dem die Antwortvariable eine additive Kombination des Faktors und der Blockeffekte ist und angenommen wird, dass keine Wechselwirkung zwischen beiden besteht. Ich denke, dies ist darauf zurückzuführen, dass wir mit RCB die Wechselwirkung BxF nicht von der Variabilität innerhalb des Blocks und der Variabilität innerhalb der experimentellen Einheiten unterscheiden können. Das Fazit ist, dass wir keine Interaktion annehmen müssen, da wir es nicht messen können. Wir können jedoch testen, ob es visuell oder mit Tukeys Test vorhanden ist.

Eine gute Quelle für experimentelles Design ist dies .

Charlie
quelle
(+1) Eine weitere gute Lektüre ist Montgomerys Design und Analyse von Experimenten .
chl
Danke @chl. Montgomery's war auf meiner Einkaufsliste, aber ich habe mich entschieden, es nicht zu kaufen, da es mehr auf Technik als auf Ökologie ausgerichtet war. Ich habe festgestellt, dass im April 2012 eine neue Ausgabe erscheinen wird. Aktualisieren Sie Ihren R-Begleiter darauf?
Charlie
1
Danke an alle. Ich habe eher einen mathematischen Verstand, dann habe ich Schwierigkeiten, Bücher wie das von Montgomery zu lesen, in denen es zu viel Text und zu wenig Mathematik gibt
Stéphane Laurent
@Charlie Yup, das ist ein Projekt aus dem Jahr 2006, als es die Doe CRAN-Task-Ansicht überhaupt nicht gab. Ich werde weiter an der 6. Version arbeiten, in der Hoffnung, sie in diesem Jahr zu beenden (aber ich sage das jedes neue Jahr, also ...). Abgesehen von dem "voreingenommenen" Anwendungsbereich finde ich, dass der Text für Psychologen und Biologen immer noch hervorragend ist.
chl
1
@ Stéphane Ich kann vorschlagen, dass Sie sich Plane Answers to Complex Questions von Christensen ansehen : Weniger DoE, mehr Mathematik und ein nettes Intro zu Linear Models.
chl
8

Hier ist eine kurze Antwort. In den meisten Dokumenten, in denen die Versuchsplanung behandelt wird, sind viele Details und Beispiele zu finden. vor allem in der Agronomie.

Oft ist der Forscher nicht an dem Blockeffekt an sich interessiert, sondern will nur die Variabilität der Reaktion zwischen Blöcken berücksichtigen. Daher betrachte ich den Block als einen Faktor mit einer bestimmten Rolle. Bemerkenswerterweise wird der Blockeffekt normalerweise als zufälliger Effekt betrachtet. Wenn Sie schließlich erwarten, dass sich der Behandlungseffekt von Block zu Block unterscheidet, sollten Wechselwirkungen in Betracht gezogen werden.

Ocram
quelle
7

Hier ist eine Umschreibung meiner Lieblingserklärung von meinem ehemaligen Lehrer Freedom King.

Sie untersuchen, wie Brotteig und Backtemperatur den Geschmack von Brot beeinflussen. Sie haben eine Bewertungsskala für Geschmack. Nehmen wir an, Sie kaufen abgepackten Brotteig bei einer Lebensmittelfirma, anstatt ihn selbst zu mischen. Jedes gebackene Brot ist eine experimentelle Einheit.

n=160

2×2

Alternativ können Sie den Ofenlauf als Blockierungsfaktor behandeln . In diesem Fall würden Sie den Ofen 40-mal ausführen, wodurch die Datenerfassung möglicherweise beschleunigt wird. Jeder Ofenlauf hätte vier Brote, aber nicht unbedingt zwei von jeder Teigart. (Das genaue Verhältnis würde zufällig ausgewählt.) Sie hätten 5 Ofenläufe für jede Temperatur; Dies könnte Ihnen helfen, die Variabilität zwischen den Ofenläufen bei gleicher Temperatur zu berücksichtigen.

Noch schicker, man könnte sowohl durch Teig als auch durch Ofenlauf blockieren . In diesem Design würden Sie genau zwei von jeder Art von Teig in jedem der Ofenläufe haben.

Wenn ich Zeit habe, um darüber nachzudenken, werde ich dies weiter mit den passenden ausgefallenen Namen für diese Versuchsentwürfe aktualisieren.

Thomas Levine
quelle
2×82×2
Ist dies ein Beispiel für eine unvollständige Blockierung?
SmallChess
6

Experimentelle Designs sind eine Kombination aus drei Strukturen:

  1. Die Behandlungsstruktur: Wie werden Behandlungen aus interessierenden Faktoren gebildet?
  2. Die Designstruktur: Wie werden experimentelle Einheiten gruppiert und Behandlungen zugeordnet?
  3. Die Antwortstruktur: Wie werden Beobachtungen gemacht?

Blöcke sind "Faktoren", die zur Entwurfsstruktur gehören (zur Unterscheidung ist es keine schlechte Idee, sie als "Blockierungsfaktoren" oder "Behandlungsfaktoren" zu bezeichnen). Sie sind gute Beispiele für Störparameter : Modellparameter, die Sie haben müssen und deren Anwesenheit Sie berücksichtigen müssen, deren Werte jedoch nicht besonders interessant sind. Bitte beachten Sie, dass dies nichts mit der Natur eines Faktors zu tun hat - blockierende Faktoren können fest oder zufällig sein, genauso wie behandelnde Faktoren fest oder zufällig sein können.

Meine persönliche Faustregel in Bezug auf die Zugehörigkeit eines Faktors zu einem experimentellen Design lautet: Wenn ich die mit dem Faktor verbundenen Parameter abschätzen und sie entweder innerhalb des Faktors oder anderer Faktorparameter vergleichen möchte, gehört sie zur Behandlungsstruktur. Wenn mir die Werte der zugehörigen Parameter egal sind und ich sie nicht vergleichen möchte, gehört der Faktor zur Entwurfsstruktur.

In dem Brotbeispiel an einer anderen Stelle in diesem Thread muss ich mir also Gedanken über die Unterschiede zwischen den einzelnen Exemplaren machen. Aber es ist mir egal, ob ich Lauf 1 mit Lauf 24 vergleiche. Der Ofenlauf gehört zur Designstruktur . Ich tun will die beiden Teige Rezepte vergleichen: Rezept gehört zur Behandlungsstruktur. Die Ofentemperatur ist mir wichtig, das gehört auch zur Behandlungsstruktur. Lassen Sie uns ein experimentelles Design erstellen.

Die Konstruktionsstruktur hat einen Faktor (Ofenbetrieb, Betrieb) und die Behandlungsstruktur zwei Faktoren (Rezept und Temperatur). Da jeder Lauf eine einzige (nominelle) Temperatur haben muss, müssen Temperatur und Lauf auf demselben Niveau wie der Versuchsaufbau liegen. In jedem Lauf ist jedoch Platz für 4 Brote. Natürlich können wir 1, 2, 3 oder 4 Brote pro Durchgang backen.

Wenn wir einen Laib pro Lauf backen und die Reihenfolge der Rezeptpräsentation nach dem Zufallsprinzip festlegen, erhalten wir eine CRD-Struktur (Completely Randomized Design). Wenn wir zwei Brote backen, eines von jedem Rezept pro Durchgang, haben wir eine zufällige vollständige Block-Design-Struktur (RCB-Struktur). Bitte beachten Sie, dass es wichtig ist, dass jedes Rezept in jedem Lauf vorkommt. Ohne diesen Saldo sind Rezeptvergleiche durch Laufdifferenzen kontaminiert. Denken Sie daran: Das Ziel des Blockierens ist es, die Run-Unterschiede zu beseitigen. Wenn wir drei Brote pro Durchgang backen, wären wir wahrscheinlich verrückt: 3 ist kein Faktor von 160, also haben wir ein oder zwei unterschiedlich große Blöcke. Die andere vernünftige Möglichkeit sind vier Laibe pro Lauf. In diesem Fall würden wir in jedem Durchgang zwei Brote von jedem Rezept backen. Auch dies ist eine RCB-Struktur. Wir können die Variabilität innerhalb eines Durchlaufs anhand der Unterschiede zwischen den beiden Laiben jedes Rezepts in jedem Durchlauf abschätzen.

Wenn Sie eine der RCB-Konstruktionsstrukturen auswählen, werden die Temperatureffekte auf der Ebene „Ausführen“ vollständig zufällig ausgewählt. Das Rezept ist in der Temperatur verschachtelt und weist eine andere Fehlerstruktur als die Temperatur auf, da jeder Teig in jedem Durchlauf erscheint. Die Kontraste, die Rezeptur und Rezeptur nach Teig-Nicht-Additivität (Wechselwirkung) betrachten, weisen keine Variabilität von Lauf zu Lauf auf. Technisch wird dies als Split-Plot- Entwurfsstruktur oder als Entwurfsstruktur mit wiederholten Messungen bezeichnet.

Welche würde der Ermittler verwenden? Wahrscheinlich hat der RCB mit vier Broten: 40 Läufe gegen 80 gegen 160 viel Gewicht. Dies kann jedoch geändert werden - wenn es sich eher um Haushaltsöfen als um industrielle Produktion handelt, kann es durchaus einen Grund geben, die CRD zu verwenden, wenn angenommen wird, dass Haushaltsbäcker selten mehrere Brote backen.

Dennis
quelle
2
Ich verfolge Ihre Analyse des Brottexperiments nicht, möglicherweise, weil mehrere unterschiedliche Entwürfe dieses Experiments erwähnt wurden und Sie nicht angeben, auf welche (n) Sie sich beziehen. Das macht die meisten Ihrer Kommentare eher verwirrend als aufschlussreich. Wenn Sie das klären könnten, würde Ihre Antwort meiner Meinung nach auffallen.
whuber
1
Die Bedeutung von # 2 verdient es, herausgestellt zu werden. Die Analyse kann auf der Grundlage der zufälligen Zuordnung von experimentellen Behandlungen durchgeführt werden: Blöcke stellen Einschränkungen für diese zufällige Zuordnung dar.
Scortchi
1
@whuber Das ist, weil ich es nicht analysiert habe, ich habe ein Experiment aus diesen Parametern de novo entworfen . In der Bearbeitung geklärt.
Dennis
3

Ich denke, die meiste Zeit ist es nur eine Frage der Konvention, wahrscheinlich passend für jeden Bereich. Ich denke, dass in einem medizinischen Kontext bei zwei Faktoren eine der Faktoren anova fast immer als "Behandlung" und die andere als "Block" bezeichnet wird.

Normalerweise ist der Blockeffekt, wie Ocram sagt, ein zufälliger Effekt, aber ich denke nicht, dass dies systematisch ist. Angenommen, Sie möchten die Wirksamkeit verschiedener medizinischer Behandlungen beurteilen:

  • Erstes Design: Jeder Patient nimmt nur eine Behandlung vor und die Effizienz wird auf einer geeigneten Skala gemessen. Sie vermuten, dass das Geschlecht des Patienten von Interesse ist: Sie werden einen "Block" männlicher und einen Block weiblicher Patienten haben. In diesem Fall ist der Block ein Faktor mit fester Wirkung.

  • Zweites Design: Jeder Patient probiert alle Behandlungen zu unterschiedlichen Zeitpunkten aus. Da die Unterschiede zwischen den Patienten unterschiedlich sind, betrachten Sie jeden Patienten als "Block". Sie interessieren sich für das Vorhandensein einer solchen Variabilität in der Bevölkerung, aber nicht für ihren Wert bei diesen bestimmten Patienten. In diesem Fall ist der Block ein Faktor mit einem zufälligen Effekt.

Nun, ich unterrichte nur dieses Zeug und versuche, mich an die Konventionen der Domäne (in Frankreich) zu halten, wie ich sie aus Lehrbüchern erhalten habe, aber ich habe nie an einer klinischen Studie teilgenommen (und möchte nicht) ... also ist dies Nur meine zwei Cent ...!

Elvis
quelle
1
2k
@chl ich denke du hast recht! Ich habe nur einige sehr einfache Beispiele
Elvis
Sie sind gut (ein Beispiel mit einem Ertrags- / Ernteexperiment aus der Landwirtschaft hätte es noch deutlicher gemacht); Ich habe nur darauf hingewiesen, dass "Blockieren" über das "Faktor" -Konzept und die Unterscheidung zwischen festen und zufälligen Werten hinausgeht.
chl
@chl, wenn du einen guten (und einfachen) Verweis auf diese Art von Sachen hast, würde ich mich freuen, ihn zu lesen (und du solltest ihn als Antwort posten) ... (auch nicht so einfache Verweise werden akzeptiert!)
Elvis
Du meinst example(aov)oder das R- Agricolae- Paket? :-)
chl