Ich bin kein Statistiker. Also, bitte ertragen Sie meine Fehler, wenn überhaupt.
Würden Sie bitte auf einfache Weise erklären, wie die Simulation durchgeführt wird? Ich weiß, dass es eine zufällige Stichprobe aus einer Normalverteilung auswählt und zur Simulation verwendet. Aber verstehe nicht klar.
simulation
Neugierig
quelle
quelle
Antworten:
In der Statistik wird die Simulation verwendet, um die Leistung einer Methode zu bewerten, typischerweise wenn ein theoretischer Hintergrund fehlt. Mit Simulationen kennt und kontrolliert der Statistiker die Wahrheit .
Die Simulation wird in einer Reihe von Situationen vorteilhaft eingesetzt. Dies umfasst die Bereitstellung der empirischen Schätzung von Stichprobenverteilungen, die Untersuchung der Fehlspezifikation von Annahmen in statistischen Verfahren, die Bestimmung der Leistung in Hypothesentests usw.
Simulationsstudien sollten mit viel Genauigkeit entworfen werden. Burton et al. (2006) gaben in ihrer Arbeit ' Das Design von Simulationsstudien in der medizinischen Statistik ' einen sehr schönen Überblick . Simulationsstudien, die in einer Vielzahl von Situationen durchgeführt wurden, finden sich in den Referenzen.
Einfaches veranschaulichendes Beispiel Betrachten Sie das lineare Modell
Hinweis : Für das oben genannte Papier liegt ein Brief an den Herausgeber vor.
quelle
Erstens gibt es in der Statistik viele, viele verschiedene Arten von Simulationen und in den umliegenden Bereichen noch mehr. Nur "Simulation" zu sagen ist ungefähr so nützlich wie "Modell" zu sagen - das heißt, überhaupt nicht viel.
Basierend auf dem Rest Ihrer Frage werde ich vermuten, dass Sie Monte-Carlo-Simulation meinen, aber selbst das ist ein wenig vage. Grundsätzlich werden wiederholt Stichproben aus einer Verteilung gezogen (dies muss nicht normal sein), um eine statistische Analyse einer künstlichen Population mit bekannten, aber zufälligen Eigenschaften durchzuführen.
Der Zweck hierfür besteht in zwei Kategorien:
Kann meine Methode mit X umgehen? : Im Wesentlichen simulieren Sie eine Reihe vieler zufälliger Populationen mit einer bekannten "richtigen" Antwort, um festzustellen, ob Ihre neue Technik Ihnen die richtige Antwort zurückgibt. Nehmen wir als grundlegendes Beispiel an, Sie haben eine Ihrer Meinung nach neue Methode entwickelt, um die Korrelation zwischen zwei Variablen, X und Y, zu messen. Sie würden zwei Variablen simulieren, bei denen der Wert von Y zusammen mit dem Wert von X abhängig ist etwas zufälliges Rauschen. Zum Beispiel ist Y = 0,25x + Rauschen. Sie würden dann eine Population mit einigen Zufallswerten von X erstellen, einige Werte von Y, die 0,25x + eine Zufallszahl waren, wahrscheinlich viele, viele tausend Male, und dann zeigen, dass Ihre neue Technik im Durchschnitt eine Zahl ausspuckt, die zeigt richtig, dass Y = 0,25x.
Was passiert wenn? Die Simulation kann als Sensitivitätsanalyse für eine vorhandene Studie durchgeführt werden. Nehmen wir zum Beispiel an, ich habe eine Kohortenstudie durchgeführt, aber ich weiß, dass meine Expositionsmessung nicht sehr gut ist. 30% meiner Probanden werden fälschlicherweise als exponiert eingestuft, wenn sie nicht exponiert sein sollten, und 10% meiner Probanden werden als nicht exponiert klassifiziert, wenn sie nicht exponiert sein sollten. Das Problem ist, ich habe keinen besseren Test, also weiß ich nicht, welcher welcher ist.
Ich würde meine Bevölkerung nehmen und jedem exponierten Subjekt eine 30% ige Chance geben, zu einem unbelichteten zu wechseln, und jedem unbelichteten Subjekt eine 10% ige Chance, zu einem exponierten zu wechseln. Ich würde dann Tausende neuer Populationen erstellen, zufällig bestimmen, welche Themen wechseln, und meine Analyse wiederholen. Der Bereich dieser Ergebnisse gibt mir eine gute Einschätzung darüber, wie stark sich mein Studienergebnis ändern könnte, wenn ich alle korrekt hätte klassifizieren können.
Wie immer ist die Simulation natürlich komplexer, nuancierter und nützlicher, je nachdem, wie viel Sie graben möchten.
quelle
Die Simulation kann auch verwendet werden, um reale Prozesse unter theoretischen Bedingungen zu betrachten, bei denen diese Prozesse nichtlineare Eingaben haben. Beispielsweise kann ein Fertigungsunternehmen daran interessiert sein, ob das Hinzufügen einer zusätzlichen Produktionslinie kostengünstig ist, und ein Callcenter kann daran interessiert sein, wie Anrufe an Betreiber weitergeleitet werden können, um die Wartezeit und die Sperrraten für Anrufer zu verringern. Dies kann eine Notaufnahme tun Sie sind daran interessiert, wie Mitarbeiter am besten zusammengestellt und Patienten transferiert werden können, oder ein Schifffahrtshafen ist möglicherweise an der effizientesten Art und Weise interessiert, seine Containeroperationen zu gestalten. Eine diskrete Ereignissimulation kann verwendet werden, um diese Prozesse zu modellieren, und man kann die Parameter anpassen, um Fragen vom Typ "Was wäre wenn" zu beantworten.
Ein weiterer Bereich, der für die Simulation von Interesse ist, sind komplexe Systeme. Insbesondere in den Sozialwissenschaften ist die agentenbasierte Simulation eine interessante Art der Simulation, bei der immer mehr Befürworter zusammenkommen. In der agentenbasierten Simulation erhalten die Agenten (z. B. einzelne Personen) Attribute wie Persönlichkeiten und interagieren miteinander, sodass ein chaotisches System modelliert wird. Die agentenbasierte Simulation untersucht die Auswirkungen der umgebenden Agenten auf einander, und die Fernwirkung kann einbezogen werden. Obwohl ich selbst keine agentenbasierten Simulationen durchgeführt habe, habe ich gesehen, dass damit Systeme wie die geografische Verteilung der Bevölkerungsgröße in einer prähistorischen Gemeinschaft im Laufe der Zeit modelliert wurden.
quelle
quelle