Okay, nur ein bisschen verschwommen in ein paar Dingen, jede Hilfe wäre sehr dankbar. Nach meinem Verständnis wird das lineare Regressionsmodell über eine bedingte Erwartung vorhergesagt
- Nehmen wir an, dass sowohl als auch Zufallsvariablen mit einer unbekannten Wahrscheinlichkeitsverteilung sind? Nach meinem Verständnis waren nur die Residuen und die geschätzten Beta-Koeffizienten Zufallsvariablen. Wenn ja, zum Beispiel, wenn Fettleibigkeit und Alter, wenn wir die bedingte Erwartung was ist der erwartete Wert von Fettleibigkeit, wenn das Individuum in der Stichprobe alt ist? Nehmen Sie einfach den Durchschnitt (arithmetisches Mittel) von y für die Beobachtungen, bei denen ? Bedeutet der erwartete Wert jedoch nicht, dass wir dies mit der Eintrittswahrscheinlichkeit multiplizieren müssen? aber wie in diesem Sinne finden wir die Wahrscheinlichkeit des-Wertvariable, die auftritt, wenn sie so etwas wie Alter darstellt?
- Wenn etwas wie den Wechselkurs darstellen würde, würde dies als zufällig eingestuft werden? Wie um alles in der Welt würden Sie den erwarteten Wert finden, ohne die Wahrscheinlichkeit zu kennen? oder würde der erwartete Wert nur dem Mittelwert im Grenzwert entsprechen.
- Wenn wir nicht annehmen, dass die abhängigen Variablen selbst Zufallsvariablen sind, da wir die Wahrscheinlichkeit nicht überschreiten, was nehmen wir dann an? nur feste Werte oder so? Aber wenn dies der Fall ist, wie können wir zunächst eine nicht zufällige Variable bedingen? Was nehmen wir über die Verteilung unabhängiger Variablen an?
Tut mir leid, wenn irgendetwas keinen Sinn ergibt oder für irgendjemanden offensichtlich ist.
regression
William Carulli
quelle
quelle
Antworten:
In dem Wahrscheinlichkeitsmodell zugrundeliegende lineare Regression, X und Y sind Zufallsvariablen.
Das stimmt. Im Allgemeinen können Sie nicht erwarten, dass Sie bei jedem bestimmten Wert von X über genügend Daten verfügen, oder es ist möglicherweise unmöglich, dies zu tun, wenn X einen kontinuierlichen Wertebereich annehmen kann. Aber konzeptionell ist das richtig.
Dies ist der Unterschied zwischen der bedingungslosen Erwartung und der bedingten Erwartung . Die Beziehung zwischen ihnen istE [ Y ∣ X = x ]E[Y] E[Y∣X=x]
Das ist das Gesetz der totalen Erwartung.
Im Allgemeinen befinden Sie sich nicht in einer linearen Regression. Da wir versuchen, zu bestimmen , müssen wir .P r [ X = x ]E[Y∣X] Pr[X=x]
Wir nehmen an, dass Y eine Zufallsvariable ist. Eine Möglichkeit, über lineare Regression nachzudenken, ist das Wahrscheinlichkeitsmodell fürY
Das heißt, sobald Sie den Wert von X kennen, ist die zufällige Variation in Y auf den Summanden .N(0,σ)
quelle
Es wird viele Antworten auf diese Frage geben, aber ich möchte noch eine hinzufügen, da Sie einige interessante Punkte angesprochen haben. Der Einfachheit halber betrachte ich nur das einfache lineare Modell.
Die Grundgleichung einer einfachen linearen Regressionsanalyse lautet: Diese Gleichungsbedeutung bedeutet, dass der Durchschnittswert von linear zu den Werten von . Man kann auch feststellen, dass der erwartete Wert auch bei den Parametern und linear ist, weshalb das Modell als linear bezeichnet wird. Diese Grundgleichung kann wie folgt umgeschrieben werden: wobei eine Zufallsvariable mit dem Mittelwert Null ist:
Die unabhängige Variable kann zufällig oder fest sein. Die abhängige Variable ist IMMER zufällig.X Y
Normalerweise nimmt man an, dass feste Zahlen sind. Dies liegt daran, dass die Regressionsanalyse entwickelt wurde und im Rahmen von entworfenen Experimenten, bei denen die -Werte zuvor festgelegt wurden , in großem Umfang angewendet wird .{X1,...,Xn} X
Die Formeln für die Schätzungen der kleinsten Quadrate von und sind dieselben, auch wenn die zufällig angenommen werden, aber die Verteilung dieser Schätzungen ist im Vergleich zur Situation mit festen im Allgemeinen nicht dieselbe .β0 β1 X X
Im einfachen linearen Modell können Sie eine Schätzung von basierend auf den Schätzungen von und , nämlich: Der Schätzer das bedingte mittlere kleinste Quadrat hat einen Ausdruck, der dem von Ihnen beschriebenen entspricht, wenn Ihr Modell die verschiedenen Gewichte als Ebenen eines einzelnen Faktors behandelt. Diese Modelle werden auch als Einweg-ANOVA bezeichnet, was ein besonderer Fall eines (nicht einfachen) linearen Modells ist.E(Y|X=x) β 0 β 1 φ (x)= β 0+ β 1xφ^(x) E(Y|X=x) β^0 β^1
quelle