Angenommen, das folgende bivariate Regressionsmodell: wobei iid für .u i N ( 0 , σ 2 = 9 ) i = 1 , … , n
Angenommen , ein noninformative Stand , dann kann gezeigt werden , dass die posterior pdf für ist wobeiβ p ( β | y ) = ( 18 π ) - 1 β =(Σ N i = 1 yixi)/(Σ n i = 1 x 2 i ).
Betrachten Sie nun den Wert von mit einem gegebenen zukünftigen Wert von , : wobei ist iid , dann können wir zeigen, dass ist eine normale Dichte mit Erwartung und Varianz Somit ist die posterior Wahrscheinlichkeitsdichtefunktion für , abhängig , ist x x n + 1 y n + 1 = β x n + 1 + u n + 1 , u n + 1 N ( 0 , σ 2 = 9 ) p ( y n + 1 | x n + 1 , y ) = ∫ β p ( y n + 1 | x n
Die Frage lautet nun: Geben Sie ein 95% -Vorhersageintervall für und interpretieren Sie es sorgfältig. In welchen Aspekten des Datengenerierungsprozesses berücksichtigt das Intervall unsere Unsicherheit nicht?
Ich bin mir nicht ganz sicher, wie ich die Frage beantworten soll, aber hier ist mein Versuch:
Im Wesentlichen müssen wir also und so finden, dass
Jetzt wissen wir, dass wobei und , daher:
Da wir nun auf konditionieren und den Ausdruck für und , sehen wir, dass sowohl als auch bekannte Werte sind. Wir können also und . Das heißt, wir können viele andere Möglichkeiten von und auswählen, die eine Wahrscheinlichkeit von . Aber wie hängt dies mit der Beantwortung des Teils der Frage zusammen, in dem gefragt wird, welche Aspekte des Datenerzeugungsprozesses dieses Intervall nicht berücksichtigt? v m v m a = - 1,96 v + m b = 1,96 v + m a b 95 %
Antworten:
Das Intervall berücksichtigt alle Unsicherheiten des Problems. In Ihrer Beschreibung des Problems sind die einzigen Dinge, die Sie nicht wissen, und . Das von Ihnen abgeleitete Vorhersageintervall berücksichtigt die Unsicherheit in beiden Fällen. Es besteht also keine Unsicherheit mehr für das Intervall, "nicht zu berücksichtigen".uβ u
quelle