Ich versuche, den Mittelwert einer mehr oder weniger Gaußschen Verteilung durch Stichproben zu schätzen. Ich habe keine Vorkenntnisse über den Mittelwert oder die Varianz. Jede Probe ist teuer zu bekommen. Wie entscheide ich dynamisch, wie viele Proben ich benötige, um ein bestimmtes Maß an Vertrauen / Genauigkeit zu erreichen? Woher weiß ich alternativ, wann ich die Probenahme beenden kann?
Alle Antworten auf Fragen wie diese, die ich finden kann, scheinen ein gewisses Wissen über die Varianz vorauszusetzen, aber das muss ich auch auf dem Weg entdecken. Andere sind auf Umfragen ausgerichtet, und mir (Anfänger) ist nicht klar, wie sich das verallgemeinert - mein Mittelwert ist nicht w / in [0,1] usw.
Ich denke, dies ist wahrscheinlich eine einfache Frage mit einer bekannten Antwort, aber mein Google-Fu versagt mir. Es wäre schon hilfreich, mir nur zu sagen, wonach ich suchen soll.
quelle
Antworten:
Sie müssen nach "Bayesian Adaptive Designs" suchen. Die Grundidee lautet wie folgt:
Sie initialisieren den Prior für die interessierenden Parameter.
Vor jeder Datenerfassung wären Ihre Prioritäten diffus. Wenn zusätzliche Daten eingehen, setzen Sie das Prior auf das Posterior zurück, das den 'Prior + -Daten bis zu diesem Zeitpunkt' entspricht.
Daten sammeln.
Berechnen Sie den Posterior basierend auf Daten + Priors. Der hintere Teil wird dann wie der vorherige in Schritt 1 verwendet, wenn Sie tatsächlich zusätzliche Daten erfassen.
Prüfen Sie, ob Ihre Stoppkriterien erfüllt sind
Zu den Stoppkriterien könnte gehören, dass das zu 95% glaubwürdige Intervall für die interessierenden Parameter nicht größer als Einheiten sein sollte. Sie könnten auch formalere Verlustfunktionen haben, die mit den interessierenden Parametern verknüpft sind, und den erwarteten Verlust in Bezug auf die hintere Verteilung für den interessierenden Parameter berechnen.±ϵ
Anschließend wiederholen Sie die Schritte 1, 2 und 3, bis Ihre Stoppkriterien aus Schritt 4 erfüllt sind.
quelle
Normalerweise möchten Sie, dass mindestens 30 den zentralen Grenzwertsatz aufrufen (obwohl dies etwas willkürlich ist). Anders als bei Umfragen usw., die anhand der Binomialverteilung modelliert werden, können Sie nicht im Voraus eine Stichprobengröße bestimmen, die eine Genauigkeit bei einem Gaußschen Prozess garantiert. Dies hängt davon ab, welche Residuen Sie erhalten, die den Standardfehler bestimmen.
Es sollte beachtet werden, dass Sie mit einer robusten Stichprobenstrategie viel genauere Ergebnisse erzielen können als mit einer viel größeren Stichprobengröße mit einer schlechten Strategie.
quelle