Ich versuche, Bestärkungslernen zu lernen und dieses Thema ist für mich wirklich verwirrend. Ich habe eine Einführung in die Statistik genommen, konnte dieses Thema aber nicht intuitiv verstehen.
quelle
Ich versuche, Bestärkungslernen zu lernen und dieses Thema ist für mich wirklich verwirrend. Ich habe eine Einführung in die Statistik genommen, konnte dieses Thema aber nicht intuitiv verstehen.
Die Stichprobe zur Ermittlung der Bedeutung ist eine Form der Stichprobe aus einer Verteilung, die sich von der Verteilung des Interesses unterscheidet , um leichter bessere Schätzungen eines Parameters aus der Verteilung des Interesses zu erhalten. In der Regel liefert dies Schätzungen des Parameters mit einer geringeren Varianz, als wenn die Stichprobe direkt aus der ursprünglichen Verteilung mit derselben Stichprobengröße entnommen würde.
Es wird in verschiedenen Zusammenhängen angewendet. Im Allgemeinen ermöglicht das Abtasten aus der unterschiedlichen Verteilung, dass mehr Proben in einem Teil der interessierenden Verteilung entnommen werden , der von der Anwendung vorgegeben wird (wichtiger Bereich).
Ein Beispiel könnte sein, dass Sie eine Stichprobe haben möchten, die mehr Stichproben aus den Endpunkten der Verteilung enthält, als reine Zufallsstichproben aus der Verteilung von Interesse liefern würden.
Der Wikipedia-Artikel , den ich zu diesem Thema gesehen habe, ist zu abstrakt. Es ist besser, sich verschiedene spezifische Beispiele anzuschauen. Es enthält jedoch Links zu interessanten Anwendungen wie Bayesian Networks.
Ein Beispiel für eine wichtige Stichprobe in den 1940er und 1950er Jahren ist eine Varianzreduktionstechnik (eine Form der Monte-Carlo-Methode). Siehe zum Beispiel das Buch Monte Carlo Methods von Hammersley und Handscomb, das 1964 als Methuen Monograph / Chapman and Hall veröffentlicht und 1966 und später von anderen Verlagen nachgedruckt wurde. Abschnitt 5.4 des Buches behandelt die Stichprobenerhebung.
Die Wichtigkeitsabtastung ist eine Simulation oder Monte-Carlo-Methode zur Approximation von Integralen. Der Begriff "Stichprobe" ist insofern etwas verwirrend, als er keine Stichproben aus einer bestimmten Verteilung liefern soll.
Die Intuition hinter der Wichtigkeitsabtastung ist, dass ein genau definiertes Integral wie kann als Erwartung für einen weiten Bereich von Wahrscheinlichkeitsverteilungen ausgedrückt werden: I = E f [ H ( X ) ] = ∫ X H ( x ) f ( x )
Wenn diese elementare Eigenschaft erst einmal verstanden ist, besteht die Umsetzung der Idee darin, sich auf das Gesetz der großen Zahlen wie bei anderen Monte-Carlo-Methoden zu stützen, dh [über einen Pseudozufallsgenerator] eine iid-Stichprobe zu simulieren n ) von verteilten f und die Approximation zu verwenden I = 1(x1,…,xn) f welches
Je nach Wahl der Verteilung , die oben Schätzer ich kann oder auch nicht eine endliche Varianz haben. Es gibt jedoch immer Optionen für f , die eine endliche Varianz und sogar eine willkürlich kleine Varianz zulassen (obwohl diese Optionen in der Praxis möglicherweise nicht verfügbar sind). Und gibt es auch Entscheidungen von f , die die Importance Sampling - Schätzer machen ich eine sehr schlechte Annäherung der ich . Dies schließt alle Möglichkeiten ein, bei denen die Varianz unendlich wird, obwohl ein kürzlich veröffentlichter Aufsatz von Chatterjee und Diaconis untersucht, wie man Wichtigkeitssampler mit der Varianz unendlich vergleicht. Das Bild unten stammt vonf I^ f f I^ I mein Blog Diskussion über das Papier und zeigt die schlechte Konvergenz unendlichen Varianz - Schätzer.
[Das Folgende ist aus unserem Buch Monte Carlo Statistical Methods wiedergegeben .]
quelle