Was bedeutet es, Vermessungsgewichte zu kalibrieren?
Was sind andere Definitionen der Kalibrierung in der Statistik? Ich habe gehört, dass es in verschiedenen Zusammenhängen verwendet wird, insbesondere bei der Risikoprognose (in Bezug darauf, ob die Gesamtzahl der vorhergesagten Ereignisse in einer Kohorte statistisch mit der beobachteten Anzahl von Ereignissen übereinstimmt).
Gibt es einen großen, einheitlichen Begriff der Kalibrierung in der Statistik?
Unser Wiki zur Kalibrierung kratzt an der Oberfläche oder wirft vielleicht die Frage auf.
Antworten:
Der Begriff "Kalibrierung" für Vermessungsgewichte scheint von Deville und Sarndal (1992) geprägt worden zu sein . Sie legten einen Regenschirm auf eine Reihe verschiedener Verfahren, bei denen die bekannten Bevölkerungszahlen verwendet wurden:
woYi ist ein Vektor von Merkmalen, die für jede Einheit in der Bevölkerung bekannt sind U . Für die allgemeine menschliche Bevölkerung wären dies Volkszählungsdaten zu demografischen Merkmalen wie Alter, Geschlecht, Rasse / ethnischer Zugehörigkeit, Bildung, Geographie (Regionen, Bundesstaaten, Provinzen) und möglicherweise Einkommen. Für Niederlassungspopulationen haben diese Variablen typischerweise mit der Größe und dem Einkommen der Niederlassung zu tun. Für Listenbeispiele - was auch immer Sie Ihrem Beispiel beigefügt haben.
Deville und Sarndal (1992) diskutierten, wie man von Entwurfsgewichten (inverse Auswahlwahrscheinlichkeiten) ausgeht.di,i∈S wo S ist die Stichprobe aus U zu kalibrierten Gewichten wi so dass
Das heißt, die Stichprobe stimmt mit der Grundgesamtheit dieser Variablen überein. Sie haben dies getan, indem sie eine Distanzfunktion optimiert haben
In der Regel, wie dies in der Statistik häufig der Fall ist, verbessert das Einbringen zusätzlicher Informationen die Varianzen asymptotisch, kann jedoch zu Problemen führen und seltsame kleine Stichprobenverzerrungen verursachen. Deville und Sarndal (1992) quantifizierten diese asymptotischen Effizienzgewinne, was ihr zentraler Beitrag zur Literatur war.
In Bezug auf die Verwendung von Hilfsdaten ist die Umfragestatistik ein ziemlich einzigartiger Zweig. Bayesianische Leute verwenden Hilfsdaten in ihren Prioren. Die iid-Frequentisten / Likelihoodisten haben normalerweise keine große Möglichkeit, Hilfsinformationen aufzunehmen, wie es scheint, da alle Informationen in der Likelihood enthalten sein müssen. Es gibt jedoch einen Zweig der empirischen Wahrscheinlichkeitsschätzung, bei dem Hilfsinformationen verwendet werden, um Schätzgleichungen zu erzeugen und / oder zu aggregieren; Tatsächlich ist die empirische Wahrscheinlichkeit objektiver Funktionen einer der objektiven Funktionsfälle, die von Deville und Sarndal (1992) betrachtet werden. (Ökonomen sollten ganz richtig schnüffeln und darauf hinweisen, dass sie seit Hansen (1982) seit mehr als 30 Jahren wissen, wie statistische Modelle mithilfe einer verallgemeinerten Methode von Momenten kalibriert werden können. ). Ein quadratischer Verlust ist ein weiterer natürlich interessanter Fall in Deville und Sarndal (1992); Während es am einfachsten zu berechnen ist, kann es zu negativen Gewichten führen, die normalerweise als seltsam angesehen werden.)
Eine andere Verwendung des Begriffs " Kalibrierung " in Statistiken, von denen ich gehört habe, ist die umgekehrte Regression, bei der Sie ungenaue Messungen der interessierenden Variablen haben und den Wert des Prädiktors wiederherstellen möchten (das laufende Beispiel, das mir von meinem gegeben wurde Der Marathonläufer eines Statistikprofessors maß die Distanz der Strecke, indem er sie radelte und die Umdrehungen der Fahrradräder zählte, im Vergleich zu genaueren GPS-Messungen - das war in den späten 1990er Jahren vor Smartphones und tragbaren GPS-Geräten.) Sie kalibrieren Ihr Fahrrad auf einem etablierten 1 km langen Kurs und versuchen Sie dann, herumzufahren, um 42 so viel zu bekommen.
Es kann noch andere Verwendungen geben. Ich bin mir nicht sicher, ob es besonders klug ist, sie alle in einem Eintrag abzulegen. Sie haben die Faktoranalyse als einen potenziellen Benutzer dieses Begriffs angegeben, aber ich weiß nicht genau, wie sie dort verwendet wird.
quelle
Angenommen, Sie führen eine Umfrage durch und erhalten 1.000 Antworten. Vielleicht haben Sie Ihre Umfrage per Handy durchgeführt und ältere Menschen haben keine Handys mit der gleichen Rate wie jüngere Menschen. 5% Ihrer Umfrageteilnehmer (N = 50) waren Senioren, aber laut dem Volkszählungsbüro der Vereinigten Staaten sind 15% der Amerikaner tatsächlich Senioren. Nehmen wir an, das Alter der Befragten spielt für Ihre Umfrageanalyse eine Rolle, für das, was Sie letztendlich veröffentlichen. Damit sich Ihre 1.000 Antworten richtig auf eine realistischere Bevölkerung verallgemeinern lassen, müssen Sie Ihren Senioren ein 3-faches Gewicht geben (das gewichtete N muss 150 sein) und die Gewichte aller anderen ein wenig verkleinern (das nicht ältere N = 950 sollte sein) ein gewichtetes N von 850). Kalibrierung, Harken und Nachschichtung sind Techniken, mit denen Sie Ihren Umfragedatensatz einer offiziellen Gesamtzahl näher bringen können.
quelle
Es gibt andere Verwendungen des Begriffs "Kalibrierung". Zum Beispiel diskutiert Frank Harrell in diesem CV-Thread dies im Zusammenhang mit der Bestimmung der Modellanpassung:
Verstehen, wie gut eine Vorhersage in der logistischen Regression ist
Typischerweise bezieht sich die Kalibrierung eines Modells bei der Vorhersagemodellierung auf die Bewertung der Anpassungsgüte (oder Modellgenauigkeit) der Trainingsdaten , während der Vorhersagefehler der Testdaten bewertet wird .
quelle
Kalibrierung bedeutet, dass Sie die gewünschten Parameter mit bekannten guten Werten einstellen, die zu erwarteten Ergebnissen führen würden. Kalibrierte Werte sind gut etablierte Werte. Das Vertrauen seiner Werte, das in der Kalibrierungskurve σ dargestellt ist, zeigt das Vertrauen in die geschätzten Werte als Abweichung vom Mittelwert μ. Hier liegen 68% der Werte innerhalb einer Standardabweichung σ vom Mittelwert entfernt; während 95% der Werte innerhalb von zwei Sigmen liegen.
quelle
Ich möchte Ihnen ein intuitives Beispiel geben, um die folgende Aussage zu erklären:
Quelle: Angewandte prädiktive Modellierung auf Seite 249
Für einen bestimmten Fall ist es schwierig, die Wahrscheinlichkeit zu veranschaulichen, aber wenn es um eine große Anzahl von Fällen geht, tritt der Effekt der Kalibrierung auf.
Zum Beispiel verwendet die Fluggesellschaft einige Algorithmen, zum Beispiel die logistische Regression ( warum? ), Um vorherzusagen, ob der Passagier an diesem Tag erscheinen wird. Sie kümmern sich eigentlich nicht darum, ob die bestimmte Person auftaucht oder nicht, und sie kümmern sich darum, wie viele Shows insgesamt stattfinden würden. Was sie tun, kann nur das Hinzufügen aller Wahrscheinlichkeiten der Vorhersagen sein. Wenn die Summe unter der Anzahl der Sitzplätze liegt, können sie Flüge überbuchen.
Einige Klassifikatoren sind nicht gut kalibriert, beispielsweise SVM. Das ist die Punktzahl, die wir erhalten, wenn die Vorhersage nicht die wahre Wahrscheinlichkeit ist.
quelle