Wie formuliere ich diese Frage statistisch um?

8

Ich analysiere einen Datensatz, der Beobachtungen aus n Versuchen von Spielern in einem Spiel enthält. Wenn ich den Aufbau eines Regressionsmodells , das Ergebnis jeder Versuch gegeben 1 oder mehr Deskriptoren zur Vorhersage bezüglich jeder Spieler versuchen , wie messe ich , wie viele Versuche , ein Spieler haben muss , bevor eine bestimmte Descriptor wird „sinnvoll“ oder „signifikant“ gegeben unserem Datensatz ?

Ein gutes Beispiel wäre eine Gruppe von Menschen, die Darts spielen. Ein absoluter Neuling könnte seine Augen schließen, den Pfeil werfen und ins Schwarze treffen. Offensichtlich wissen wir, dass dies ein reiner Zufall war, er hat noch nie zuvor gespielt, und zum Teufel könnte er sogar betrunken sein. Aber nehmen wir an, er wirft 5 weitere Pfeile und trifft 3 weitere Male ein Bullauge von diesen 5. Er hat jetzt 6 Pfeile geworfen und 50% der Zeit ein Bullauge getroffen. Jetzt werden die Dinge verdächtig ...

Ab wann wirft dieser echte Neuling genug Bull's Eye Darts und wie viele Versuche braucht er, bevor wir sagen können, dass er ernsthaftes Talent gegenüber anderen erfahreneren Spielern hat? Was ist dieser Begriff in der Statistik und wo kann ich mehr darüber erfahren?

Haftungsausschluss: Ich habe versucht, geladene statistische Begriffe wie "Signifikanz" und "Beobachtungen" so weit wie möglich zu vermeiden, obwohl ich sie an bestimmten Stellen für angemessen hielt.

Wenn mich jemand in die richtige Richtung weisen kann, wäre das fantastisch. Vielen Dank!!

KidMcC
quelle
2
Sie sind nur ein paar Schritte davon entfernt, Bayesianer zu werden ...
Marcelo Ventura
Es ist also eine Frage der Konfidenzintervalle, wenn bis zu einem gewissen Grad mehr Pfeile geworfen werden?
KidMcC
Was Sie betrachten, könnte sequentielles Testen sein. Oder Sie möchten möglicherweise die statistische Leistung berechnen. Dies ist die Anzahl der Stichproben, die Sie ziehen müssen, um den Beta-Fehler zu verringern. Beachten Sie, dass die Samples nicht unabhängig sind, wenn Sie sich einen bestimmten Player ansehen. All dies könnte natürlich auch in ein Bayes'sches Gerüst eingebettet sein, wie der erste Kommentator sagte.
Regenschein
Adaptiv und sequentiell sind zwei nützliche Schlüsselwörter.
whuber

Antworten:

1

Darts ist das einfachste Spiel. Jeder Spieler beginnt mit einer Punktzahl von 501 und wirft abwechselnd 3 Pfeile. Die Punktzahl für jede Runde wird berechnet und von der Gesamtsumme der Spieler abgezogen. Bullseye erhält 50 Punkte, der äußere Ring 25 Punkte und ein Pfeil im Doppel- oder Dreifachring zählt doppelt oder dreifach die Segmentpunktzahl.

Bild von http://www.shotdarts.com/darts-info/play-darts

Jetzt wurden die Wahrscheinlichkeiten an anderer Stelle untersucht . Auf dieser Seite wird uns gesagt: "Ein mittelschwerer Dartspieler hat eine größere Standardabweichung. Obwohl die Schüsse im Durchschnitt um dasselbe Ziel zentriert sind, werden sie über eine breitere Region verteilt. Ein schlechter Dartspieler wird dies tun." haben eine hohe Standardabweichung und ihre Aufnahmen werden wahrscheinlich über einen viel größeren Bereich verstreut sein. " Das heißt , Dartpartituren.

Um die Frage zu beantworten, tun wir das, was wir immer tun. Wir erstellen ein Histogramm der Punktzahlen, und für das Spiel selbst können wir 501 Punkte verwenden. Dann passen wir eine Dichtefunktion an und testen diese Dichtefunktion gegen die Dichtefunktionen anderer Spieler. Wir brauchen also genügend Daten, damit unser Standort und seine Abweichung genügend Vorhersagekraft haben, um zwischen Spielern richtig zu unterscheiden. Je weniger Daten, desto unschärfer die Antworten, und es gibt keine magische Zahl dafür, desto besser.

Carl
quelle