Standardabweichung mehrerer Messungen mit Unsicherheiten

13

Ich habe zwei 2 Stunden GPS-Daten mit einer Abtastrate von 1 Hz (7200 Messungen). Die Daten werden in der Form gegeben (X,Xσ,Y,Yσ,Z,Zσ) , wobei Nσ ist die Messunsicherheit.

Wenn ich den Mittelwert aller Messungen nehme (z. B. den durchschnittlichen Z-Wert dieser zwei Stunden), wie hoch ist die Standardabweichung? Ich kann natürlich die Standardabweichung von den Z-Werten berechnen, vernachlässige dann aber die Tatsache, dass Messunsicherheiten bekannt sind ...

Bearbeiten: Die Daten stammen alle von derselben Station, und alle Koordinaten werden jede Sekunde neu gemessen. Aufgrund von Satellitenkonstellationen usw. weist jede Messung eine andere Unsicherheit auf. Der Zweck meiner Analyse ist es, die Verschiebung aufgrund eines äußeren Ereignisses (dh eines Erdbebens) zu finden. Ich möchte den Mittelwert für 7200 Messungen (2 Stunden) vor dem Erdbeben und einen weiteren Mittelwert für 2 Stunden nach dem Erdbeben nehmen und dann die resultierende Differenz berechnen (z. B. in der Höhe). Um die Standardabweichung dieser Differenz zu bestimmen, muss ich die Standardabweichung der beiden Mittel kennen.

Zugführer
quelle
3
Gute Frage. Noch wichtiger ist, dass die Daten im Laufe der Zeit stark positiv korrelieren: Dies hat einen stärkeren Einfluss auf die Antwort als die Variation der Messunsicherheiten.
Whuber
Sie haben Whubers Kommentar und Deathkill14s Antwort aufgegriffen und uns nicht genügend Informationen gegeben, um richtig zu antworten. Es ist wichtig zu wissen, wie die Fehler beim Messen von "funktionieren". Wenn zum Beispiel der Fehler bei der Messung von X nach 3 Sekunden positiv war, ist es mehr oder weniger wahrscheinlich, dass er nach 4 Sekunden positiv ist - dh gibt es eine serielle Korrelation? Zweitens ist es mehr / weniger wahrscheinlich, dass der Fehler in Y und / oder Z nach 3 Sekunden positiv ist , wenn der Fehler in X nach 3 Sekunden positiv war. Bei 2 Sekunden? Bei 4 Sekunden? X,Y,ZXXYZ
Bill
Eine verwandte, etwas andere Frage lautet: Wie systematisch ist der Messfehler? Angenommen, ich sagte: "Ja, wurde auf meinem Rasen ein wenig hoch gemessen . X wird auf meinem Rasen fast immer ein wenig hoch gemessen." Wäre das eine verrückte Aussage? Funktioniert der Messfehler so, dass ein bestimmter Ort sehr oft zu hoch ist, während ein anderer Ort sehr oft zu niedrig ist, usw. "Oder ist der gesamte Fehler vorübergehend?XX
Bill
@Bill: Es gibt definitiv eine serielle Korrelation. Die Messfehler sind über die zwei Stunden ziemlich konstant. Sie sind jedoch in der Regel größer als die aus den Daten berechnete Standardabweichung, was mich zu dieser Frage geführt hat.
Traindriver
Ihre Frage verdeutlicht die Existenz einer seriellen Korrelation immer noch nicht eindeutig. Leider haben Sie drei sorgfältig konstruierte Antworten, die für Sie bei weitem nicht so nützlich sind, wie sie vielleicht waren.
Glen_b -Reinstate Monica

Antworten:

7

Ich vermute, dass die vorherigen Antworten auf diese Frage ein bisschen falsch sind. Es scheint mir , dass das ursprüngliche Plakat , was wirklich hier fragt als „gegeben eine Reihe von Vektormessungen umformuliert werden: mit i = 1 , 2 , 3 , . . . , 7200 und Messkovarianz : C i = ( X 2 σ , i 0 0 0 Y

θi=(XiYiZi)
i=1,2,3,...,7200
Ci=(Xσ,i2000Yσ,i2000Zσ,i2)
Wie würde ich den kovarianzgewichteten Mittelwert für diese Reihe von Vektormessungen korrekt berechnen und danach, wie würde ich seine Standardabweichung korrekt berechnen? "Die Antwort auf diese Frage kann lauten gefunden in vielen Lehrbüchern, die sich auf Statistik für die Naturwissenschaften spezialisiert haben, ein Beispiel, das ich besonders mag, ist Frederick James, "Statistical Methods in Experimental Physics", 2. Auflage, World Scientific, 2006, Abschnitt 11.5.2, "Kombinieren unabhängiger Schätzungen", S. 323-324. Ein weiterer sehr guter, aber einleitender Text, der die varianzgewichtete Mittelwertberechnung für Skalarwerte (im Gegensatz zu den oben dargestellten vollständigen Vektorgrößen) beschreibt, ist Philip R. Bevington und D. Keith Robinson, "Data Reduction and Error Analysis" for the Physical Sciences " , 3. Auflage, McGraw-Hill, 2003, Abschnitt 4.1.x," Gewichtung der Daten - Uneinheitliche Unsicherheiten ". Weil die Frage des Posters eine Diagonale hatKovarianzmatrix In diesem Fall (dh alle nicht diagonalen Elemente sind Null) ist das Problem tatsächlich in drei einzelne (dh X, Y, Z) skalargewichtete mittlere Probleme trennbar, sodass die Bevington- und Robinson-Analyse gleichermaßen gut anwendbar sind auch hier.

Im Allgemeinen finde ich es bei der Beantwortung von Fragen zu stackexchange.com normalerweise nicht nützlich, lange Ableitungen, die bereits in zahlreichen Lehrbüchern vorgestellt wurden, neu zu verpacken - wenn Sie das Material wirklich verstehen und verstehen möchten, warum die Antworten so aussehen So wie sie es tun, dann sollten Sie einfach die Erklärungen lesen, die bereits von den Lehrbuchautoren veröffentlicht wurden. In diesem Sinne werde ich einfach direkt zu den Antworten springen, die andere bereits gegeben haben. Nach Frederick James beträgt der gewichtete Mittelwert bei : - 1 i ) - 1 ( N i = 1 C -N=7200

θmean=(i=1NCi1)1(i=1NCi1θi)
Cmean=(i=1NCi1)1
Ci

XiYiZi und die Varianz istX2σ,meeinn=1

Xmean=i=1NXiXσ,i2i=1N1Xσ,i2
oder äquivalentXσ,mean=
Xσ,mean2=1i=1N1Xσ,i2
und ähnlich fürYmEeinen,Yσ,meanundZmEeinen,Zσ,mEeinen. Ein kurzer Wikipedia-Eintrag, der ebenfalls zu dieser Antwort für den skalarwertigen Fall führt, isthierverfügbar.
Xσ,mean=1i=1N1Xσ,i2
Ymean,Yσ,meanZmean,Zσ,mean
Stachyra
quelle
Vielleicht war ich ein bisschen unklar, also habe ich ein paar Infos hinzugefügt. Ich glaube nicht, dass ich meine Maße beschweren muss.
Traindriver
1
Ja, das tust du. Stellen Sie sich einen Extremfall wie ein Gedankenexperiment vor: Nehmen Sie an, Sie haben nur 2 GPS-Messungen anstelle von 7200. Nehmen Sie außerdem an, dass eine der GPS-Messungen eine Unsicherheit von +/- 5 Fuß aufweist, während die andere eine Unsicherheit von + / - 5 Meilen. Die Unsicherheitszahl sagt Ihnen buchstäblich, wie ungenau die Messung sein kann. Das bedeutet, dass der Wert von +/- 5 Meilen wahrscheinlich mindestens einige Meilen entfernt ist. Möchten Sie diese Zahl wirklich sinnvoll in Ihren Durchschnitt aufnehmen? Mit der gewichteten Mittelung können Sie Werte diskontieren, denen nicht so sehr vertraut werden sollte.
Stachyra
1
Übrigens, meine Antwort hat noch eine andere Bedeutung: In Ihrem ursprünglichen Beitrag erwähnen Sie, dass Sie die Standardabweichung der Stichprobe, die direkt aus den Z-Werten berechnet wird, nicht einfach verwenden möchten, weil Sie in diesem Fall Folgendes tun würden: in Ihren eigenen Worten, "vernachlässigen Sie die Tatsache, dass Messunsicherheiten bekannt sind". Meine Antwort (nun ja, die obskure Lehrbuchantwort, die ich einfach mit Ihnen teile) verwendet die bekannten Messunsicherheiten genau so, wie Sie es gewünscht haben. Es ist nur so, dass es die Informationen an mehr Stellen verwendet (mittleres Ergebnis sowie Standardabweichung), als Sie erwartet hatten.
Stachyra
Du hast mich überzeugt.
Traindriver
6

Dies sollte leicht durch Bayes'sche Inferenz gelöst werden können. Sie kennen die Messeigenschaften der einzelnen Punkte in Bezug auf ihren wahren Wert und möchten auf den Populationsmittelwert und die SD schließen, die die wahren Werte generiert haben. Dies ist ein hierarchisches Modell.

Umformulierung des Problems (Bayes-Grundlagen)

Beachten Sie, dass orthodoxe Statistiken nur einen Mittelwert liefern, während Sie im Bayes'schen Rahmen eine Verteilung der glaubwürdigen Werte des Mittelwerts erhalten. ZB könnten die Beobachtungen (1, 2, 3) mit SDs (2, 2, 3) durch die Maximum-Likelihood-Schätzung von 2, aber auch durch einen Mittelwert von 2,1 oder 1,8 erzeugt worden sein, obwohl dies (gemessen an den Daten) etwas weniger wahrscheinlich ist als die MLE. Neben dem SD schließen wir also auch den Mittelwert .

Ein weiterer konzeptioneller Unterschied besteht darin, dass Sie Ihren Wissensstand definieren müssen, bevor Sie Beobachtungen anstellen. Wir nennen das Priors . Möglicherweise wissen Sie im Voraus, dass ein bestimmter Bereich in einem bestimmten Höhenbereich gescannt wurde. Das völlige Fehlen von Wissen würde darin bestehen, einheitliche (-90, 90) Grad wie zuvor in X und Y und möglicherweise einheitliche (0, 10000) Meter in der Höhe (über dem Ozean, unter dem höchsten Punkt der Erde) zu haben. Sie müssen Prior-Verteilungen für alle Parameter definieren, die Sie schätzen möchten, dh für die Sie Posterior-Verteilungen erhalten möchten . Dies gilt auch für die Standardabweichung.

Wenn Sie also Ihr Problem umformulieren, gehe ich davon aus, dass Sie glaubwürdige Werte für drei Mittelwerte (X.Mittelwert, Y.Mittelwert, X.Mittelwert) und drei Standardabweichungen (X.SD, Y.SD, X.SD) ableiten möchten generiert Ihre Daten.

Das Model

Wenn Sie die Standard-BUGS-Syntax verwenden (verwenden Sie WinBUGS, OpenBUGS, JAGS, Stan oder andere Pakete, um dies auszuführen), würde Ihr Modell ungefähr so ​​aussehen:

  model {
    # Set priors on population parameters
    X.mean ~ dunif(-90, 90)
    Y.mean ~ dunif(-90, 90)
    Z.mean ~ dunif(0, 10000)
    X.sd ~ dunif(0, 10)  # use something with better properties, i.e. Jeffreys prior.
    Y.sd ~ dunif(0, 10)
    Z.sd ~ dunif(0, 100)

    # Loop through data (or: set up plates)
    # assuming observed(x, sd(x), y, sd(y) z, sd(z)) = d[i, 1:6]
    for(i in 1:n.obs) {
      # The true value was generated from population parameters
      X[i] ~ dnorm(X.mean, X.sd^-2)  #^-2 converts from SD to precision
      Y[i] ~ dnorm(Y.mean, Y.sd^-2)
      Z[i] ~ dnorm(Z.mean, Z.sd^-2)

      # The observation was generated from the true value and a known measurement error
      d[i, 1] ~ dnorm(X[i], d[i, 2]^-2)  #^-2 converts from SD to precision
      d[i, 3] ~ dnorm(Y[i], d[i, 4]^-2)
      d[i, 5] ~ dnorm(Z[i], d[i, 6]^-2)
    }
  }

Natürlich überwachen Sie die .mean- und .sd-Parameter und verwenden deren posterioren Parameter zur Inferenz.

Simulation

Ich habe einige Daten wie diese simuliert:

# Simulate 500 data points
x = rnorm(500, -10, 5)  # mean -10, sd 5
y = rnorm(500, 20, 5)  # mean 20, sd 4
z = rnorm(500, 2000, 10)  # mean 2000, sd 10
d = cbind(x, 0.1, y, 0.1, z, 3)  # added constant measurement errors of 0.1 deg, 0.1 deg and 3 meters
n.obs = dim(d)[1]

Anschließend wurde das Modell mit JAGS für 2000 Iterationen nach einem Burnin von 500 Iterationen ausgeführt. Hier ist das Ergebnis für X.sd.

posterior for X.sd

Der blaue Bereich gibt das 95% -ige Intervall für die höchste posteriore Dichte oder das glaubwürdige Intervall an (wenn Sie glauben, dass der Parameter nach der Beobachtung der Daten ermittelt wurde. Beachten Sie, dass ein orthodoxes Konfidenzintervall dies nicht ergibt).

Die rote vertikale Linie ist die MLE-Schätzung der Rohdaten. Normalerweise ist der wahrscheinlichste Parameter in der Bayes'schen Schätzung auch der wahrscheinlichste (maximale Wahrscheinlichkeits-) Parameter in orthodoxen Statistiken. Aber Sie sollten sich nicht zu sehr um die Oberseite des Seitenzahns kümmern. Der Mittelwert oder Median ist besser, wenn Sie ihn auf eine einzelne Zahl reduzieren möchten.

Beachten Sie, dass MLE / top nicht bei 5 liegt, da die Daten zufällig generiert wurden und nicht aufgrund falscher Statistiken.

Einschränkungen

Dies ist ein einfaches Modell, das derzeit mehrere Mängel aufweist.

  1. Die Identität von -90 und 90 Grad wird nicht verarbeitet. Dies kann jedoch erreicht werden, indem eine Zwischenvariable erstellt wird, die die Extremwerte der geschätzten Parameter in den Bereich (-90, 90) verschiebt.
  2. X, Y und Z werden derzeit als unabhängig modelliert, obwohl sie wahrscheinlich korreliert sind. Dies sollte berücksichtigt werden, um die Daten optimal zu nutzen. Dies hängt davon ab, ob sich das Messgerät bewegt hat (serielle Korrelation und gemeinsame Verteilung von X, Y und Z liefern Ihnen viele Informationen) oder ob es stillsteht (Unabhängigkeit ist in Ordnung). Ich kann die Antwort erweitern, um dies zu erreichen, wenn dies gewünscht wird.

Ich sollte erwähnen, dass es eine Menge Literatur zu räumlichen Bayes'schen Modellen gibt, über die ich mich nicht auskenne.

Jonas Lindeløv
quelle
Danke für diese Antwort. Es handelt sich um Daten von einer festen Station. Bedeutet dies jedoch, dass die Daten unabhängig sind?
Traindriver
@traindriver Sie müssen weitere Informationen zum Inferenzproblem bereitstellen, damit wir Ihnen helfen können. Sie könnten Ihre Frage mit einem Abschnitt "Aktualisieren" erweitern, in dem mindestens (1) angegeben wird, ob es sich um dieselbe Menge handelt, die wiederholt gemessen wird. Dh die gleiche Koordinate. Oder wird ein Bereich gescannt oder ... (2) warum möchten Sie den Mittelwert und die SD ableiten? Wenn es sich um ein Gebiet handelt, möchten Sie möglicherweise SD als Schätzwert für Unebenheiten oder ähnliches verwenden.
Jonas Lindeløv
Ich habe einige weitere Informationen im ursprünglichen Beitrag hinzugefügt.
Traindriver
3

Ich führe zunächst eine Notation ein und richte das Problem mit dem von Ihnen erwähnten einfachen Ansatz ein. Dann geh weiter. ich werde benützenz um sich auf den von Ihnen angegebenen Vektor Z zu beziehen.

Betrachten Sie das folgende Modell, bei dem der explizite Erwähnungsmessfehler fehlt: Z¯=ich=1nμZ+ϵichn, wo Z¯ ist der geschätzte Durchschnittswert von z, und μZ ist der wahre Durchschnittswert von Z. Hier, ϵ ist ein Vektor der Fehler in Ihren Daten, und Sie erwarten dies, wenn Ihre Stichprobe groß ist Z¯ konvergieren zu μZ. Wenn Sie einfach das Beobachtete nehmenZ Werte und deren Durchschnitt erhalten Sie Z¯ und wenn Sie die Standardabweichung der Stichprobe berechnen, erhalten Sie σ^, die Schätzung der wahren Populationsstandardabweichung σ. Was ist, wenn Sie etwas Wissen über den Messfehler nutzen möchten?

Beachten Sie zunächst, dass wir das ursprüngliche Modell wie folgt umformulieren können: z=1β+ϵ, wo 1 ist ein Vektor von Einsen und β wird am Ende sein Z¯. Das sieht nun wirklich nach Regression aus, aber wir bekommen im Grunde immer noch nur eine Schätzung vonμZ. Wenn wir eine solche Regression durchführen, erhalten wir auch eine Schätzung für den Standardfehler vonϵ, das ist fast das, was wir wollen - das ist nichts als der Standardfehler von z (aber wir wollen immer noch Messfehler berücksichtigen).

Wir können unser ursprüngliches Modell erweitern, um ein Modell mit gemischten Effekten zu erhalten. z=1β+Q.u+ϵ, wo u ist ein Vektor von zufälligen Effekten, und Q. ist der Regressor im Zusammenhang z zu u. Wie bei jedem zufälligen Effekt müssen Sie eine Annahme über die Verteilung von treffenu. Ist es richtig, dassZσ ist die Verteilung des Messfehlers für z? Wenn ja, kann dies verwendet werden, um die Verteilung der zufälligen Effekte bereitzustellen. In der Regel geht die Software zur Durchführung der grundlegenden Modellierung gemischter Effekte davon aus, dass die zufälligen Effekte eine normale Verteilung haben (mit dem Mittelwert 0 ...) und die Varianz für Sie schätzen. Vielleicht können Sie dies versuchen, um das Konzept zu testen. Wenn Sie Ihre vorherigen Informationen zur Verteilung des Messfehlers verwenden möchten, ist ein Bayes'sches Mischeffektmodell in Ordnung. Sie können R2OpenBUGS verwenden.

Nach der Schätzung dieses Modells erhalten Sie den Standardfehler für die Residuen ϵDies ist der Standardfehler, an dem Sie Ihr Interesse bekunden. Intuitiv saugt die Zufallseffektkomponente des Modells einige der Variationen auf, die Sie erklären können, weil Sie wissen, dass ein Messfehler vorliegt. Auf diese Weise können Sie eine relevantere Schätzung der Variation von erhaltenϵ

Sehen Sie dieses Papier für eine tiefere Diskussion zu diesem Ansatz von zufälligen Effekten Rechnung für Messfehler. Ihre Situation ähnelt der, für die die Autoren eine Einführung gebenD und sein Messfehler beschädigte Version W. Das Beispiel in Abschnitt 4 bietet möglicherweise einige Einblicke in Ihre Situation.

Wie von whuber erwähnt, möchten Sie möglicherweise die Autokorrelation in Ihren Daten berücksichtigen. Die Verwendung von zufälligen Effekten löst dieses Problem nicht.

Deathkill14
quelle