Die Stichprobe wird typischerweise in dem Sinne als homogen angenommen, dass die Fehlerterme in der Gleichung die folgenden Bedingungen erfüllen:ϵiyi=β0+β1x1+β2x2+…+ϵi
- Alle haben den Mittelwert Null: für alle i ,E(ϵi)=0i
- Sind nicht korreliert: für i ≠ j ,Cov(ϵi,ϵj)=0i ≠ j
- C o v ( ϵich) = σ2ich
Diese sind als Gauß-Markov-Bedingungen bekannt und stellen sicher, dass der gewöhnliche Schätzer der kleinsten Quadrate eine gute Leistung erbringt (Unparteilichkeit, bester linearer unverzerrter Schätzer ...).
Beachten Sie, dass diese Bedingungen auch dann erfüllt werden können, wenn Sie Beobachtungen aus verschiedenen Gruppen haben. Oft ist dies jedoch nicht der Fall. Wenn es Unterschiede im Mittelwert zwischen den Gruppen gibt, werden die erste und die zweite Bedingung verletzt. Wenn es innerhalb der Gruppen Korrelationen gibt, wird die zweite Bedingung verletzt. Wenn sich die Gruppen in der Varianz unterscheiden, wird die dritte verletzt.
Verstöße gegen die Gauß-Markov-Bedingungen können alle möglichen Probleme verursachen. Einige der Folgen einer nicht konstanten Varianz finden Sie auf der Wikipedia-Seite zur Heteroskedastizität .
Transformationen können nützlich sein, wenn die dritte Bedingung nicht erfüllt ist. Wenn die verschiedenen Gruppen jedoch Probleme mit den Bedingungen eins und zwei verursachen, erscheint es sinnvoller, eine Gruppen-Dummy-Variable hinzuzufügen oder ANCOVA zu verwenden.