Technische Variation gegenüber realem Signal

8

Ich teste auf Unterschiede in einem kontinuierlichen Ergebnis unter drei verschiedenen Bedingungen.

Unter der Bedingung AI wird das Ergebnis gemessen. Ich mache das zweimal für die gleiche Probe. Beispielwerte könnten 2.2, 2.1 sein. Dies sind "technische" Replikate, die aus derselben biologischen Quelle stammen

Ich mache dasselbe für vier "biologische" Replikate für Bedingung A:

A1, measure 1: 2.2
A1, measure 2: 2.1
A2, measure 1: 2.0
A2, measure 2: 2.1
A3, measure 1: 1.9
A3, measure 2: 1.8
A4, measure 1: 1.5
A4, measure 2: 1.6

Ich habe auch die Bedingungen B, C und D mit zwei "technischen" Replikaten in jedem von vier "biologischen" Replikaten.

Wie würde ich den Test auf mittlere Unterschiede (ANOVA) testen, die sowohl die technische als auch die biologische Variation am besten berücksichtigen? Ich möchte kein Modell anpassen, das jede Messung als separate Beobachtung zählt, da jedes Paar aus derselben biologischen Probe stammt. Ich gehe davon aus, dass es einen besseren Weg geben muss, als nur über die Paare zu mitteln.

Bonus: Wie machst du das in R?

Angenommen, ich habe Daten, die so aussehen:

> data
   condition sample measurement outcome
1          A      1           1     2.2
2          A      1           2     2.1
3          A      2           1     2.0
4          A      2           2     2.1
5          A      3           1     1.9
6          A      3           2     1.8
7          A      4           1     1.5
8          A      4           2     1.6
9          B      1           1     1.7
10         B      1           2     1.6
11         B      2           1     1.5
12         B      2           2     1.6
13         B      3           1     1.4
14         B      3           2     1.3
15         B      4           1     1.0
16         B      4           2     1.1
17         C      1           1     2.4
18         C      1           2     2.3
19         C      2           1     2.2
20         C      2           2     2.3
21         C      3           1     2.1
22         C      3           2     2.0
23         C      4           1     1.7
24         C      4           2     1.8

Ich würde wahrscheinlich so etwas nicht machen wollen:

summary(lm(outcome~condition, data=data))

Danke im Voraus.

Stephen Turner
quelle

Antworten:

1

Das Problem ist, dass Sie verschiedene mögliche Zufallsquellen haben. Individuelle Zufälligkeit (der normale Fehlerterm in einer linearen Regression); Variation zwischen Ihren beiden Messungen in jedem Fall; und Abweichung von den bestimmten Einheiten, die Sie abgetastet haben. Ich denke du willst wahrscheinlich so etwas

model <- aov(outcome ~ condition + Error(samp + measurement), data=mydata)
summary(model)

Ich hoffe, das hilft.

Peter Ellis
quelle