Auf der Suche nach dem 'Ellbogen' in Daten

8

Die Subitisierung ist die schnelle und genaue Aufzählung von Anzeigen mit geringer Anzahl, die sich von der Zählung durch eine scharfe Nichtlinearität in der Darstellung der Antwortzeiten unterscheidet. Unten ist eine repräsentative Darstellung von Watson, DG, Maylor, EA und Bruce, LAM (2007). Beachten Sie, dass die mittleren Aufzählungszeiten für die Anzeigen 1-3 ungefähr linear ansteigen, die mittlere Aufzählungszeit für 4 jedoch nicht dem linearen Trend folgt. Einige Untersuchungen legen nahe, dass das Subitisierungslimit von den Aufgabenbedingungen und dem Arbeitsgedächtnis der Teilnehmer abhängt.

Geben Sie hier die Bildbeschreibung ein

Ich suche nach einer Möglichkeit, um zu testen, wo sich der Ellbogen befindet, mit dem ultimativen Ziel, das Subitisierungslimit eines Teilnehmers zu ermitteln. Derzeit ist meine beste Idee, so etwas wie wiederholte Polynomkontraste zu machen. Grundsätzlich würde ich auf einen quadratischen Trend in den Numerositäten 1-3, dann in den Numerositäten 1-4 usw. testen. Ich möchte sagen, dass ich die Subitisierungsgrenze überschritten habe, wenn der quadratische Trend signifikant wird (Anpassung für wiederholte Tests).

Das sind jedoch die Grenzen meines statistischen Könnens, daher kann ich diese Idee nicht allzu gut bewerten. Gedanken?

Danke im Voraus.

Nathan
quelle

Antworten:

3

Abhängig von Ihrer Definition des "Ellbogens" stehen Ihnen viele statistische Tests zur Verfügung. Mit einem kompletten R-Paket zu diesem Thema.

Ich persönlich neige dazu, sie zu meiden, da Sie nie im Voraus wissen, was sie als "Ellbogen" betrachten und ob Ihre und ihre Meinungen übereinstimmen werden. (Dies kann jedoch als extreme Position angesehen werden.) Es hängt auch davon ab, ob Sie wissen möchten, ob sich an einem bestimmten Ort ein "Ellbogen" befindet, oder ob Sie generell fragen möchten, ob es einen gibt.

Für den Fall eines bestimmten Ortes können Sie natürlich eine lokale Regression anpassen, die Koeffizienten vergleichen und einen nach Ihrer eigenen Regel über den Unterschied in den Steigungen als Ellbogen deklarieren.

Das eigentliche Problem tritt im letzteren Fall auf. Wenn Sie sowieso nur ein paar Punkte haben, können Sie sie alle ausprobieren. Andernfalls würde ich etwas Nicht-Parametrisches wie LOESS anpassen und den Gradienten der Linie in regelmäßigen Abständen (mit ausreichender Dichte) berechnen, wie hier gezeigt: /programming/12183137/calculate-min-max- Steigung-von-Löss-angepasste-Kurve-mit-r

und verwenden Sie erneut eine Regel, die Sie für zweckmäßig halten, um etwas als "Ellbogen" zu deklarieren. Ich betrachte den "Ellbogen" als den Fall, in dem eine ausreichend große Änderung des Gradienten einer Funktion über ein ausreichend kurzes Intervall auftritt. Natürlich sind die Schwellenwerte für die oben genannten Regeln eine Frage des individuellen Geschmacks, weshalb es keinen Test gibt.

Im Allgemeinen gehe ich davon aus, dass dies ziemlich nutzlos wäre, wenn die Daten wackelig wären (da sich der Gradient stark ändern würde).

Mittel zur Bedeutung
quelle
Ich bin anderer Meinung: Es gibt viele statistische Tests für den "Ellbogen", sofern er mit ausreichender Klarheit definiert ist. Dies ist ein Beispiel für ein Änderungspunkt- oder Strukturänderungsproblem .
whuber
1
Ich sollte wohl die Antwort dann umformulieren. Mein Punkt war genau, dass der Kern in der Definition des "Ellbogens" liegt. Außerdem vertraue ich der Anwendung eines Änderungspunktverfahrens auf (Zeitreihen-) Daten nicht, da ich nie weiß, inwieweit sich die Definition des Autors des "Ellbogens" von meiner unterscheidet. Daher habe ich mich dafür ausgesprochen, eine persönliche Regel zur Identifizierung des "Ellbogens" zu erstellen, anstatt einen Teil des Regalwerkzeugs zu verwenden. Möglicherweise haben Sie keinen statistischen Test, aber zumindest wenn Sie ihn erstellen, wissen Sie, was er bewirkt und wie er dazu neigt, Kurven zu kennzeichnen.
bedeutet-zu-Bedeutung
+1 Es ist ein sehr guter Punkt.
whuber