Wie groß sollte eine Stichprobe für eine bestimmte Schätztechnik und Parameter sein?

11

Gibt es eine Faustregel oder überhaupt eine Möglichkeit zu bestimmen, wie groß eine Stichprobe sein sollte, um ein Modell mit einer bestimmten Anzahl von Parametern zu schätzen?

Wenn ich beispielsweise eine Regression der kleinsten Quadrate mit 5 Parametern schätzen möchte, wie groß sollte die Stichprobe sein?

Ist es wichtig, welche Schätztechnik Sie verwenden (z. B. maximale Wahrscheinlichkeit, kleinste Quadrate, GMM) oder wie viele oder welche Tests Sie durchführen werden? Sollte die Stichprobenvariabilität bei der Entscheidung berücksichtigt werden?

Vivi
quelle

Antworten:

10

Die triviale Antwort lautet, dass immer mehr Daten weniger Daten vorgezogen werden.

Das Problem der kleinen Stichprobengröße ist klar. In der linearen Regression (OLS) können Sie technisch ein Modell wie OLS mit n = k + 1 anpassen, aber Sie werden Müll daraus bekommen, dh sehr große Standardfehler. Zu diesem Thema gibt es eine großartige Arbeit von Arthur Goldberger namens Micronumerocity, die in Kapitel 23 seines Buches A Course in Econometrics zusammengefasst ist .

Eine häufige Heuristik ist, dass Sie für jeden Parameter, den Sie schätzen möchten, 20 Beobachtungen haben sollten. Es ist immer ein Kompromiss zwischen der Größe Ihrer Standardfehler (und damit der Signifikanzprüfung) und der Größe Ihrer Stichprobe. Dies ist ein Grund, warum einige von uns Signifikanztests hassen, da Sie mit einer enormen Stichprobe einen unglaublich kleinen (relativen) Standardfehler erhalten und daher bei naiven Tests eine sinnlose statistische Signifikanz finden können, z. B. ob ein Regressionskoeffizient Null ist.

Während die Stichprobengröße wichtig ist, ist die Qualität Ihrer Stichprobe wichtiger, z. B. ob die Stichprobe für die Bevölkerung verallgemeinerbar ist, ob es sich um eine einfache Zufallsstichprobe oder eine andere geeignete Stichprobenmethode handelt (und dies bei der Analyse berücksichtigt wurde), liegt ein Messfehler vor , Antwortverzerrung, Auswahlverzerrung usw.

Graham Cookson
quelle
3

Ich verwende gerne Resampling: Ich wiederhole jede Methode, die ich verwendet habe, mit einer Teilstichprobe der Daten (z. B. 80% oder sogar 50% der Gesamtzahl). Wenn ich dies mit vielen verschiedenen Teilstichproben mache, bekomme ich ein Gefühl dafür, wie robust die Schätzungen sind. Für viele Schätzverfahren kann dies zu einer realen (dh publizierbaren) Schätzung Ihrer Fehler gemacht werden.

Hbar
quelle
2

Es sollte immer groß genug sein! ;)

Alle Parameterschätzungen weisen eine Schätzunsicherheit auf, die durch die Stichprobengröße bestimmt wird. Wenn Sie eine Regressionsanalyse durchführen, sollten Sie sich daran erinnern, dass die Χ 2 -Verteilung aus dem Eingabedatensatz erstellt wird. Wenn Ihr Modell 5 Parameter und 5 Datenpunkte hätte, könnten Sie nur einen einzelnen Punkt der Χ 2- Verteilung berechnen. Da Sie es minimieren müssen, können Sie nur diesen einen Punkt als Schätzung für das Minimum auswählen, müssen aber Ihren geschätzten Parametern unendliche Fehler zuweisen. Wenn Sie mehr Datenpunkte haben, können Sie den Parameterraum besser abbilden, was zu einer besseren Schätzung des Minimums der Χ 2 -Verteilung und damit zu kleineren Schätzfehlern führt.

Würden Sie stattdessen einen Maximum-Likelihood-Schätzer verwenden, wäre die Situation ähnlich: Mehr Datenpunkte führen zu einer besseren Schätzung des Minimums.

Die Punktvarianz müsste ebenfalls modelliert werden. Wenn mehr Datenpunkte vorhanden sind, wird die Häufung von Punkten um den "wahren" Wert (aufgrund des zentralen Grenzwertsatzes) offensichtlicher, und die Gefahr, eine große zufällige Schwankung zu interpretieren, würde sinken, da der wahre Wert für diesen Punkt sinken würde. Und wie bei jedem anderen Parameter würde Ihre Schätzung für die Punktvarianz umso stabiler, je mehr Datenpunkte Sie haben.

Benjamin Bannier
quelle
2

Ich habe diesbezüglich zwei Faustregeln gehört. Man ist der Meinung, dass es Ihnen gut geht, solange der Fehlerterm genügend Beobachtungen enthält, um den zentralen Grenzwertsatz hervorzurufen, z. B. 20 oder 30. Die andere besagt, dass man für jede geschätzte Steigung mindestens 20 oder 30 Beobachtungen haben sollte. Der Unterschied zwischen der Verwendung von 20 oder 30 als Zielzahl beruht auf unterschiedlichen Überlegungen, wann genügend Beobachtungen vorliegen, um den zentralen Grenzwertsatz angemessen zu evozieren.

russellpierce
quelle
1
Die beiden Antworten sehen für mich zu unterschiedlich aus. Einer sagt 20 bis 30, der andere sagt 20 bis 30 mal Steigungen. Wenn Sie also 5 Steigungen haben, sagt Ihnen eine Regel 20 bis 30, die anderen 100 bis 150 Beobachtungen. Das scheint mir nicht richtig zu sein ...
Vivi
1
Das sind ziemlich unterschiedliche Richtlinien. Ich vermute, dass die Trennung darin besteht, ob Sie der Meinung sind, dass der Test des Gesamtmodells wichtig ist (die niedrigere N-Richtlinie) oder der Test der einzelnen Steigungen, die wichtig sind (die höhere N-Richtlinie).
Russellpierce