Ich löse Rubiks Würfel als Hobby. Ich zeichne die Zeit auf, die ich gebraucht habe, um den Würfel mit einer Software zu lösen, und jetzt habe ich Daten aus Tausenden von Lösungen. Die Daten sind im Grunde genommen eine lange Liste von Zahlen, die die Zeit darstellen, die jede sequentielle Lösung benötigt hat (z. B. 22.11, 20.66, 21.00, 18.74, ...).
Die Zeit, die ich brauche, um den Würfel zu lösen, variiert natürlich etwas von Lösung zu Lösung, daher gibt es gute und schlechte Lösungen.
Ich möchte wissen, ob ich "heiß werde" - ob die guten Lösungen in Streifen kommen. Wenn ich zum Beispiel nur ein paar gute Lösungen hintereinander hatte, ist es dann wahrscheinlicher, dass meine nächste Lösung gut ist?
Welche Art von Analyse wäre angemessen? Ich kann mir einige spezifische Dinge vorstellen, die zu tun sind, zum Beispiel die Lösungen als Markov-Prozess zu behandeln und zu sehen, wie gut eine Lösung die nächste vorhersagt, und mit zufälligen Daten zu vergleichen, um zu sehen, wie lange die längsten Streifen aufeinanderfolgender Lösungen unter dem Median der letzten liegen 100 sind und vergleichen mit dem, was in zufälligen Daten usw. zu erwarten wäre. Ich bin mir nicht sicher, wie aufschlussreich diese Tests sein würden, und frage mich, ob es einige gut entwickelte Ansätze für diese Art von Problem gibt.
quelle
Ein paar Gedanken:
Zeichnen Sie die Verteilung der Zeiten. Ich vermute, dass sie positiv verzerrt sind, so dass einige Lösungszeiten sehr langsam sind. In diesem Fall möchten Sie möglicherweise ein Protokoll oder eine andere Transformation der Lösungszeiten in Betracht ziehen.
Erstellen Sie ein Streudiagramm des Versuchs auf der x-Achse und der Lösungszeit (oder protokollieren Sie die Lösungszeit auf der y-Achse). Dies sollte Ihnen ein intuitives Verständnis der Daten vermitteln. Es kann neben dem "heißen Streifen" auch andere Arten von Trends aufdecken.
Überlegen Sie, ob sich im Laufe der Zeit ein Lerneffekt ergibt. Bei den meisten Rätseln wird das Üben schneller. Die Handlung soll Aufschluss darüber geben, ob dies der Fall ist. Ein solcher Effekt unterscheidet sich von einem "Hot Streak" -Effekt. Dies führt zu einer Korrelation zwischen Versuchen, da beim ersten Lernen langsame Versuche zusammen mit anderen langsamen Versuchen auftreten und mit zunehmender Erfahrung schnellere Versuche zusammen mit schnelleren Versuchen auftreten.
Betrachten Sie Ihre konzeptionelle Definition von "heißen Streifen". Gilt dies beispielsweise nur für Versuche, die zeitlich in der Nähe liegen oder sich auf die Nähe der Ordnung beziehen. Angenommen, Sie haben den Würfel am Dienstag schnell gelöst und dann eine Pause eingelegt. Am nächsten Freitag haben Sie ihn schnell gelöst. Ist das ein heißer Streifen oder zählt es nur, wenn Sie es am selben Tag tun?
Gibt es andere Effekte, die sich von einem Hot-Streak-Effekt unterscheiden könnten? ZB die Tageszeit, zu der Sie das Rätsel lösen (z. B. Müdigkeit), inwieweit Sie sich tatsächlich anstrengen? usw.
Sobald die alternativen systematischen Effekte verstanden wurden, können Sie ein Modell entwickeln, das so viele wie möglich enthält. Sie können den Rest auf der y-Achse und den Versuch auf der x-Achse zeichnen. Dann können Sie sehen, ob die Residuen im Modell Autokorrelationen aufweisen. Diese Autokorrelation würde einige Hinweise auf heiße Streifen liefern. Eine alternative Interpretation ist jedoch, dass es einen anderen systematischen Effekt gibt, den Sie nicht ausgeschlossen haben.
quelle
Berechnen Sie das Korrelogramm für Ihren Prozess. Wenn Ihr Prozess Gauß'sch ist (wie es in Ihrer Stichprobe aussieht), können Sie Unter- / Obergrenzen (B) festlegen und prüfen, ob die Korrelationen bei gegebener Verzögerung signifikant sind. Eine positive Autokorrelation bei Verzögerung 1 würde auf das Vorhandensein von "Glücksstreifen" hinweisen.
quelle