Betrachten Sie das einfache lineare Modell:
wo und , und enthalten eine Spalte von Konstanten.
Meine Frage ist: Gibt es bei , und eine Formel für eine nicht triviale Obergrenze für *? (unter der Annahme, dass das Modell von OLS geschätzt wurde).
* Ich ging beim Schreiben davon aus, dass es nicht möglich wäre , selbst zu erhalten.
EDIT1
Mit der von Stéphane Laurent abgeleiteten Lösung (siehe unten) können wir eine nicht triviale Obergrenze für . Einige numerische Simulationen (unten) zeigen, dass diese Grenze tatsächlich ziemlich eng ist.
Stéphane Laurent hat folgendes abgeleitet: wobei eine nicht-zentrale Beta-Verteilung mit ist Nichtzentralitätsparameter mitB ( p - 1 , n - p , λ ) λ
So
Dabei ist ein nicht zentrales mit dem Parameter und Freiheitsgraden. Also eine nicht triviale Obergrenze für≤ 2 λ k E ( R 2 ) ist ,
es ist sehr eng (viel enger als ich erwartet hatte möglich wäre):
Zum Beispiel mit:
rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)
Der Mittelwert der über 1000 Simulationen ist . Die obige theoretische Obergrenze gibt . Die Schranke scheint für viele Werte von gleich genau zu sein . Wirklich erstaunlich!0.960819
0.9609081
EDIT2:
Nach weiteren Untersuchungen scheint es , dass die Qualität der oberen Approximation von besser wird, wenn zunimmt (und alle anderen Werte gleich, nimmt mit ).λ + p λ n
quelle
Antworten:
Es kann jedes lineare Modell geschrieben werden: wobei G die Standardnormalverteilung auf R n hat und μ als zu einem linearen Unterraum W von R n gehörig angenommen wird . In deinem Fall ist W = Im ( X )Y=μ+σG G Rn μ W Rn W=Im(X) .
Sei der eindimensionale lineare Unterraum, der vom Vektor ( 1 , 1 , … , 1 ) erzeugt wird . Mitnahmen U = [ 1 ] unterhalb die R 2 ist stark in Bezug auf die klassischen Fisher - Statistik F = ‖ P Z Y ‖ 2 / ( m - l )[1]⊂W (1,1,…,1) U=[1] R2
für den Hypothesentest vonH0:{& mgr;∈U}woU⊂Wist ein linearer Unterraum und Bezeichnen von Z=U⊥∩Wdem orthogonalen Komplement derUinW, und Bezeichnenm=dim(W)undl=dim(U)
In der Tat ist , da die Definition vonR2ist R2= ‖ P Z Y ‖ 2
Offensichtlich und P ⊥ W Y = σ P ⊥ W G .PZY=PZμ+σPZG P⊥WY=σP⊥WG
Wenn wahr ist,H0:{μ∈U} dann ist und daher ist
F = ‖ P Z G ‖ 2 / ( m - ℓ )PZμ=0
hat dieVerteilungFisherFm-ℓ,n-m. Aus der klassischen Beziehung zwischen der Fisher-Verteilung und der Beta-Verteilung ergibt sich folglichR2∼B(m-ℓ,n-m).
In der allgemeinen Situation müssen wir umgehen , wenn P Z & mgr; ≠ 0 . In diesem allgemeinen Fall hat man ‖ P Z Y ‖ 2 ~ σ 2 χ 2 m - l ( λ ) , die nichtzentrale χ 2 Verteilung mit m - l Freiheitsgraden und noncentrality Parametern λ = ‖PZY=PZμ+σPZG PZμ≠0 ∥PZY∥2∼σ2χ2m−ℓ(λ) χ2 m−ℓ und dann
F∼Fm-ℓ,n-m(λ)(nichtzentrale Fisher-Verteilung). Dies ist das klassische Ergebnis zur Berechnung der Potenz vonFλ=∥PZμ∥2σ2 F∼Fm−ℓ,n−m(λ) F Tests.
Die klassische Beziehung zwischen der Fisher-Distribution und der Beta-Distribution gilt auch in der nicht zentralen Situation. Schließlich hat die nichtzentrale Beta-Verteilung mit "Formparametern" m - ℓ und n - m und dem Nichtzentralitätsparameter λR2 m−ℓ n−m λ . Ich denke, die Momente sind in der Literatur verfügbar, aber möglicherweise sehr kompliziert.
Zum Schluss schreiben wir . Man beachte, dass P Z = P W - P U ist . Man hat P U μ = ˉ μ 1, wenn U = [ 1 ] und P W μ = μ . Daher ist P Z μ = μ - ˉ μ 1, wobei μ = X β für den unbekannten Parametervektor β ist .PZμ PZ=PW−PU PUμ=μ¯1 U=[1] PWμ=μ PZμ=μ−μ¯1 μ=Xβ β
quelle