Angenommen, Sie haben eine Gruppe von Leuten, die bewerten, wie sehr sie einen Film auf einer diskreten Skala von 1 bis 10 mochten, und Sie möchten ein Intervall [ l , u ], das mit (mindestens) 95% Vertrauen (mindestens) 90 beträgt % aller Personen, die den Film sehen, bewerten ihn nicht niedriger als l und nicht höher als u . [ l , u ] ist dann ein (zweiseitiges) Toleranzintervall mit 95% Konfidenz und 90% Abdeckung. (Um klar zu sein, bedeutet 95% iges Vertrauen, dass bei mehrmaliger Wiederholung dieses Verfahrens 95% der erzeugten Intervalle eine Bevölkerungsabdeckung von mindestens 90% erhalten würden.) Natürlich möchten wir im Allgemeinen, dass [ l , u ] so eng wie möglich ist möglich, während unsere Anforderungen noch erfüllt werden.
Ich habe verschiedene nichtparametrische Methoden zum Erstellen von Toleranzintervallen für kontinuierliche Zufallsvariablen gesehen. Ich habe auch Methoden zum Erstellen von Toleranzintervallen für Binomial- und Poisson-Variablen gesehen. (Das R-Paket tolerance
implementiert mehrere dieser Methoden; Young, 2010.) Aber was ist mit diskreten Variablen, wenn die Verteilung unbekannt ist? Dies ist im Allgemeinen bei Bewertungsskalen wie der in meinem Beispiel der Fall, und die Annahme einer Binomialverteilung scheint nicht sicher zu sein, da echte Bewertungsskalendaten häufig Verrücktheiten wie Multimodalität aufweisen.
Wäre es sinnvoll, auf die nichtparametrischen Methoden für kontinuierliche Variablen zurückzugreifen? Was ist alternativ mit einer Monte-Carlo-Methode wie dem Generieren von 1.000 Bootstrap-Replikaten der Stichprobe und dem Finden eines Intervalls, das mindestens 90% der Stichprobe in mindestens 950 der Replikate erfasst?
Young, DS (2010). Toleranz: Ein R-Paket zur Schätzung von Toleranzintervallen. Journal of Statistical Software, 36 (5), 1–39. Abgerufen von http://www.jstatsoft.org/v36/i05
quelle
Antworten:
Die interessierende Variable ist multinomial verteilt mit Klassenwahrscheinlichkeiten (Zellenwahrscheinlichkeiten): . Ferner sind die Klassen mit einer natürlichen Ordnung ausgestattet.p1, p2, . . . , p10
Erster Versuch: kleinstes "Vorhersageintervall" mit90 %
Ein nichtparametrisches Maß für die Unsicherheit (z. B. Varianz, Vertrauen) in den -quantilen Schätzungen könnte tatsächlich durch Standard-Bootstrap-Methoden erhalten werden .l , u
Zweiter Ansatz: direkte "Bootstrap-Suche"
Im Folgenden stelle ich ausführbaren Matlab-Code zur Verfügung, der sich der Frage direkt aus einer Bootstrap-Perspektive nähert (der Code ist nicht optimal vektorisiert).
Überprüfen Sie, ob dies sinnvoll ist.
Führen Sie die Bootstrap-Simulation aus.
Filter aus jedem Bootstrap replizieren die Intervalle , die eine Wahrscheinlichkeitsmasse von mindestens enthalten, und berechnen eine (häufig auftretende) Konfidenzschätzung dieser Intervalle.90 %[l,u] 90%
Wählen Sie diejenigen aus, die das Vertrauens-Desiderat erfüllen.
Überzeugen Sie sich davon, dass die oben genannte Bootstrap-Methode gültig ist
Bootstrap-Beispiele sollen als Ersatz für etwas dienen, das wir gerne hätten, aber nicht, dh: neue, unabhängige Draws aus der tatsächlichen zugrunde liegenden Population (kurz: neue Daten).
In dem Beispiel, das ich gegeben habe, kennen wir den Datengenerierungsprozess (DGP), daher könnten wir die Codezeilen für Bootstrap-Neuabtastungen durch neue, unabhängige Draws aus dem tatsächlichen DGP "betrügen" und ersetzen.
Dann können wir den Bootstrap-Ansatz validieren, indem wir ihn mit dem Ideal vergleichen. Unten sind die Ergebnisse.
Die Konfidenzmatrix aus neuen, unabhängigen Daten zeichnet:
Die entsprechenden -Konfidenz-Unter- und Obergrenzen:95%
Wir stellen fest, dass die Konfidenzmatrizen eng übereinstimmen und dass die Grenzen identisch sind ... Dies bestätigt den Bootstrap-Ansatz.
quelle