Angenommen, Ihr Datensatz besteht aus einer Menge für i = 1 , … , n, und Sie möchten die Abhängigkeit von y von x untersuchen .( xich, yich)i = 1 , ... , nyx
Angenommen , Sie die Werte finden a und β von α und β , dass minimieren , um die Restsumme der Quadrate
n Σ i = 1 ( y i - ( α + β x i ) ) 2 .
Dann nehmen Sie y = α + β x der vorhergesagt wird y - Wert für jeden (nicht notwendigerweise bereits beobachtet) x -Wertes. Das ist eine lineare Regression.α^β^αβ
∑i = 1n( yich- ( α + βxich) )2.
y^= α^+ β^xyx
Betrachten Sie nun die Zerlegung der Gesamtsumme der Quadrate
mitn-1Freiheitsgraden, in "erklärt" und "unerklärlichen" Teile:
n Σ i = 1 ( ( α + β x i ) - ˉ y ) 2 ⏟ erläuterte+ n Σ i = 1 ( y i - ( α + β x i ) ) 2 ⏟ unerklärt.
mit1
∑i = 1n( yich- y¯)2wo y¯= y1+ ⋯ + ynn
n - 1∑i = 1n( ( α^+ β^xich) - y¯)2erklärt + ∑ i = 1n( yich- ( α^+ β^xich) )2unerklärt.
1bzw.
Freiheitsgrade. Das Varianzanalyse, und man dann hält Dinge wie F-Statistik
F = Σ n i = 1 ( ( α + β x i ) - ˉ y ) 2 / 1n - 2DieseF-Statistik testet die Nullhypothese
β=0.
F= ∑ni = 1( ( α^+ β^xich) - y¯)2/ 1∑ni = 1( yich- ( α^+ β^xich) )2/ (n-2).
β= 0
y= α + βich
ichkk - 1n - k
Ein paar zusätzliche Punkte:
- Für einige Mathematiker kann der obige Bericht den Anschein erwecken, dass das gesamte Feld nur das ist, was oben zu sehen ist, und es kann daher rätselhaft erscheinen, dass sowohl die Regression als auch die Varianzanalyse aktive Forschungsbereiche sind. Es gibt vieles, was nicht in eine Antwort passt, die hier veröffentlicht werden kann.
- y= α + βx
Der Hauptunterschied ist die Antwortvariable. Während sich die logistische Regression mit einer binären Antwort in der linearen Regressionsanalyse und auch mit einer nichtlinearen Regression befasst, ist die Antwortvariable kontinuierlich. Sie haben eine (oder mehrere) Variable (n) (auch Kovariaten genannt), die eine funktionale Beziehung zur kontinuierlichen Antwortvariablen haben. Bei der Varianzanalyse ist das Ansprechen kontinuierlich, gehört jedoch zu einigen verschiedenen Kategorien (z. B. Behandlungsgruppe und Kontrollgruppe). Bei der Varianzanalyse wird nach Unterschieden in der mittleren Antwort zwischen den Gruppen gesucht. In der linearen Regression sehen Sie, wie sich die Reaktion ändert, wenn sich die Kovariaten ändern. Ein anderer Weg, um den Unterschied zu betrachten, ist zu sagen, dass die Kovariaten in der Regression kontinuierlich sind, während sie in der Varianzanalyse eine diskrete Gruppe von Gruppen sind.
quelle
Die Varianzanalyse (ANOVA) ist eine statistische Methode zur Analyse von Beobachtungen, deren Struktur angenommen wird
Wenn der {xich j } sind Werte, die in den Beobachtungen nicht von Zählervariablen, sondern von stetigen Variablen wie übernommen werden t = Zeit,T = Temperatur,t2, e- T usw, dann haben wir einen Fall von * Regressionsanalyse. In der Regressionsanalyse werden im Allgemeinen alle Faktoren quantitativ und quantitativ behandelt.
Hauptsächlich sind dies zwei Arten von Analysen.
quelle
In der Regressionsanalyse haben Sie eine Variable festgelegt und möchten wissen, wie die Variable mit der anderen Variablen verhält.
Bei der Varianzanalyse möchten Sie zum Beispiel wissen, ob dieses spezielle Tierfutter das Gewicht der Tiere beeinflusst ... SO eine feste Varianz und der Einfluss auf die anderen.
quelle