Bedeutung von "Design" in der Designmatrix?

13

In der linearen Regression, Y=Xβ , warum X die Design - Matrix genannt? Kann X bis zu einem gewissen Grad wie in der Kunst willkürlich entworfen oder konstruiert werden?

StackExchange für alle
quelle
3
Der Ursprung des Begriffs ist ziemlich alt, und ich glaube, er geht auf die Ursprünge der Inferenzstatistik bei der Analyse von Experimenten zurück; Ich denke, es bezog sich insbesondere auf die Art und Weise, in der sich die X-Matrix auf den tatsächlichen Versuchsaufbau bezog (die spezifischen Einstellungen der x Werte). Wenn ich eine bestimmte Referenz finden kann, schreibe ich eine Antwort.
Glen_b
@ Glen_b: Danke! Hat "Design" etwas mit der Auswahl einer Transformation für die Eingabevariable zu tun, sodass die Ausgabevariable auch in der transformierten Eingabevariable linear ist? Zum Beispiel die Entwurfsmatrix in der Polynomregression?
StackExchange for All
2
Wenn Sie ein Experiment entwerfen, geben Sie die Werte von . X
whuber

Antworten:

15

Um ein Beispiel in Zeile zu geben mit @ neverKnowsBest Antwort, die Auffassung , dass in einem faktoriellen Experiment gibt es 3 Faktoren, die jeweils so behandelt , als kategorische Variablen mit 2 Ebenen, und jede mögliche Kombination der Faktorstufen innerhalb jeder Replikation getestet. Wenn das Experiment nur einmal durchgeführt würde (keine Replikation), würde dieses Design 2 3 = 8 Läufe erfordern . Die Durchläufe durch die folgende 8x3 - Matrix beschrieben werden: [ 0 0 0 1 0 0 0 1 0 1 1 0 0 0 1 1 0 1 0 1 1 12323=8

[000100010110001101011111]
wobei die Zeilen die Läufe darstellen und die Spalten die Ebenen der Faktoren darstellen: (Die erste Spalte steht für den Faktor A, die zweite Spalte B und die dritte Spalte C). Dies wird alsEntwurfsmatrix bezeichnet,da sie den Entwurf des Experiments beschreibt. Der erste Lauf wird auf der "niedrigen" Ebene aller Faktoren gesammelt, der zweite Lauf wird auf der "hohen" Ebene von Faktor A und der "niedrigen" Ebene von Faktoren B und C gesammelt und so weiter.
[ABC].

[1000111011000011101001011110100010011001110101001011001011111111]
[IABCABACBCABC].

Zitate

Montgomery, D. (2009). Versuchsplanung und Versuchsanalyse, 7. Auflage. John Wiley & Sons Inc.

tjnel
quelle
9

XXXy=Xβ

Die Versuchsplanung konzentriert sich darauf, wie die Entwurfsmatrix und die Modellmatrix konstruiert werden, da dies geschieht, bevor Daten gesammelt werden. Wenn die Daten bereits erfasst wurden, ist das Design in Stein gemeißelt, aber Sie können die Modellmatrix trotzdem ändern. Manchmal enthält ein entworfenes Experiment in der Entwurfsmatrix bestimmte feste Spalten, sogenannte Kovariaten , die nicht kontrolliert werden können, die Sie jedoch beobachten können.

Es gibt einige Dinge, die abhängig von Ihrer Wahl des Modells und der Konstruktion passieren können. Bestimmte Parameter können schwer abzuschätzen sein (größere Abweichungen des Schätzers) oder Sie sind möglicherweise nicht in der Lage, bestimmte Parameter überhaupt abzuschätzen. Ich würde sagen, die Entscheidung für ein geeignetes Modell hat einige Kunstelemente, und es ist sicherlich eine Kunst, Experimente zu entwerfen.

neverKnowsBest
quelle
2
Dies ist sehr hilfreich, aber hier ist eine Fußnote zu "Kovariate". Einige Leute verwenden diesen Begriff viel allgemeiner für jede Art von Prädiktor oder unabhängiger Variable. (Viele andere Synonyme existieren natürlich.)
Nick Cox
(+1) Sehr schön für Ihren ersten Beitrag - Willkommen auf unserer Seite!
Whuber
2

X ist nur Ihre Daten (abzüglich der Antwortvariablen). Ich glaube, es wird als Entwurfsmatrix bezeichnet, da es den "Entwurf" Ihres Modells definiert (über Schulung).

Kann X bis zu einem gewissen Grad wie in der Kunst willkürlich entworfen oder konstruiert werden?

Grundsätzlich läuft diese Frage darauf hinaus, "ob Sie ein Modell bauen können, das auf hergestellten Daten basiert", auf das die Antwort offensichtlich "ja" lautet. Hier ist eine Möglichkeit zum Erstellen einer beliebigen Entwurfsmatrix (Entwurfsvektor), die ein Modell mit einer vordefinierten Steigung und einem vordefinierten Achsenabschnitt ergibt:

design_mat=function(b, a){
  X = runif(100)
  Y = a*X + b
  data.frame(X,Y)
}

df = design_mat(-5, 12.3)

(lm(Y~X, data=df))

Call:
lm(formula = Y ~ X, data = df)

Coefficients:
(Intercept)            X  
       -5.0         12.3  

In meinem Beispiel habe ich zur Veranschaulichung die Antwort aus zufälligen Konstruktionsdaten "konstruiert", aber Sie hätten die Konstruktionsmatrix genauso einfach aus einer zufälligen Antwort unter Verwendung von konstruieren könnenX=Yba

David Marx
quelle