Verwenden von Dezibel in Statistiken

11

Ich arbeite an einem Projekt, bei dem RFID-Tags gelesen und die Signalstärke verglichen werden, die der Leser sieht, wenn Sie die Antennenkonfiguration ändern (Anzahl der Antennen, Position usw.). Im Rahmen des Projekts muss ich die Setups vergleichen, um festzustellen, welche am effektivsten sind.

Idealerweise könnte ich entweder einen ungepaarten t-Test oder eine ANOVA zwischen zwei Antennenpositionen (oder eine MANOVA zwischen mehreren) durchführen. Da die Antwort jedoch in logarithmischen Dezibel angegeben ist, frage ich mich, wie ich am besten damit umgehen kann.

Wäre es am besten, die Ergebnisse in eine lineare Skala umzuwandeln und dann mit einer der von mir genannten Methoden zu vergleichen, oder sollte ich Dezibel verwenden, da sie mit einem anderen statistischen Test verglichen werden?

Brian Truman
quelle
2
Hat sich die Freiheit genommen, Tags zu bearbeiten. Mathematische Statistik ist in der Praxis ein nutzloses Etikett. Logarithmische Reihen beziehen sich auf etwas ganz anderes mit einer diskreten Antwort.
Nick Cox
1
Wenn Sie Tests verwenden, bei denen eine Gaußsche Verteilung angenommen wird, ist es sinnvoll, in der logarithmischen Skala zu bleiben, wenn die Verteilung der Antworten in dB "mehr Gauß'sch" als in der linearen Skala ist (dh die Originaldaten sind ungefähr logarithmisch normal).
Luca Citi
@NickCox, ich denke, mathematical-statisticsfunktioniert gut, wenn ein Proof angefordert wird, wobei das entsprechende Tag ein Synonym für das vorherige Tag ist.
Richard Hardy
Vielleicht hätte ich "ein nutzloses Etikett für diese Art von Frage" sagen sollen.
Nick Cox

Antworten:

5

Ob transformiert werden soll, hängt davon ab, auf welcher Skala Sie Ihre Schlussfolgerung ziehen möchten.

Im Allgemeinen entspricht die Varianz einer Funktion von nicht der Funktion der Varianz von x . Weil σxxxmitftransformiert, dann statistische Inferenz (Hypothesentests oder Konfidenzintervalle) fürf(x) durchführtund dann-f-1- die Ergebnisse dieser Inferenz zurücktransformiert Die Anwendung aufxist ungültig (da sowohl Teststatistiken als auch CIs eine Schätzung der Varianz erfordern).σf(x)2f(σx2)xff(x)f1x

Wenn CIs auf transformierten Variablen + Rücktransformation basieren, werden Intervalle ohne die nominalen Abdeckungswahrscheinlichkeiten erzeugt. Das rücktransformierte Vertrauen in eine auf basierende Schätzung ist also kein Vertrauen in eine auf x basierende Schätzung .f(x)x

Ebenso bedeutet Rückschlüsse auf nicht transformierte Variablen basierend auf Hypothesentests für transformierte Variablen, dass eine der folgenden Aussagen zutreffen kann, wenn beispielsweise Rückschlüsse auf basierend auf einer Gruppierungsvariablen y gezogen werden :xy

  1. unterscheidet sich signifikant über y , aber f ( x ) unterscheidet sich nicht signifikant über y .xyf(x)y

  2. unterscheidet sich signifikant über y und f ( x ) unterscheidet sich signifikant über y .xyf(x)y

  3. unterscheidet sich nicht signifikant zwischen y und f ( x ) unterscheidet sich nicht signifikant zwischen y .xyf(x)y

  4. unterscheidet sich nicht signifikant zwischen y , aber f ( x ) unterscheidet sich signifikant zwischen y .xyf(x)y

Kurz gesagt, wenn Sie wissen, ob sich zwischen Gruppen von y signifikant unterscheidet , können Sie nicht feststellen, ob sich x zwischen y unterscheidet .f(x)yxy

Die Frage, ob diese dBs transformiert werden sollen, wird also dadurch beantwortet, ob Sie sich für dB oder potenzierte dB interessieren.

Alexis
quelle
14

Streng genommen müssen wir Ihre Daten sehen, um endgültige Ratschläge geben zu können, aber es ist möglich zu raten.

Wie Sie sagen, sind Dezibel bereits logarithmisch. Dies bedeutet wahrscheinlich aus einer Vielzahl von physikalischen und statistischen Gründen, dass sie sich sehr wahrscheinlich gut verhalten, indem sie ungefähr additiv, homoskedastisch und symmetrisch verteilt sind, abhängig von Prädiktoren. Möglicherweise können Sie jedoch ein physikalisches oder technisches Argument dafür angeben, wie sich die Antwort ändern sollte, wenn Sie Ihre Entwurfsvariablen ändern.

Ich kenne kein mögliches Prinzip oder eine Theorie, die besagt, dass Sie verpflichtet sind, sie zu potenzieren, bevor Sie einen Test oder eine ANOVA anwenden . Ich würde erwarten, dass das statistische Verhalten schlechter und nicht besser wird.t

Die gleiche Argumentation gilt normalerweise für andere "vortransformierte" logarithmische Skalen wie den pH-Wert oder die Richterskala.

PS: Keine Ahnung, was RFID-Tags sind.

Nick Cox
quelle
4
RFID-Tags sind Radiofrequenz-ID-Tags ... die Dinge in Ihrem Reisepass, Bibliotheksmaterial, abgebrochener Kreditkarte usw., die eine tokenbasierte ID drahtlos ermöglichen.
Alexis
2
Zufällig wirkende Abstimmungen. Ich habe nicht viel Grund zur Beschwerde, da ich mehrere Stimmen für wenig Arbeit habe und es keine gute Antwort ist. (Ich hätte ein besseres schreiben können, wenn ich einige Daten gesehen hätte.) Aber die Abwertung ist zwecklos: Ohne Angabe von Gründen gibt es keinen Raum, um jemandes Meinung zu ändern!
Nick Cox
3
Ich weiß es schon gut? Ich wünschte wirklich , Down-Wähler würden konstruktives Feedback hinterlassen.
Alexis
3

Die einzige Möglichkeit, diese Frage endgültig zu beantworten, besteht darin, einige Dezibeldaten zu betrachten. Gibt es eine einfache Verteilung (z. B. Gaußsche Verteilung), die ein gutes Modell dafür ist? Oder ist das Exponential der Daten ein besserer Kandidat? Ich vermute, dass die nicht exponentiellisierten Daten näher an Gauß liegen. Um eine nachfolgende Analyse einfacher zu gestalten, sollten Sie dies verwenden, aber ich werde Sie beurteilen lassen.

Ich habe Probleme mit Ihrer vorgeschlagenen Analyse, bei der ein Signifikanztest auf beobachtete Daten aus verschiedenen Experimenten (nämlich verschiedene Antennenpositionen) angewendet wird. Wenn man die Physik davon betrachtet, muss es einen Unterschied geben, vielleicht winzig, vielleicht erheblich. Aber a priori gibt es einen Unterschied, daher müssen Sie bei einem ausreichend großen Datensatz die Nullhypothese ohne Unterschied ablehnen. Die Wirkung eines Signifikanztests besteht also nur darin, zu dem Schluss zu kommen, dass Sie einen großen Datensatz haben / nicht haben. Das scheint nicht sehr nützlich zu sein.

Nützlicher wäre es, den Unterschied zwischen verschiedenen Antennenpositionen zu quantifizieren und möglicherweise auch Kosten und Nutzen zu berücksichtigen, um zu entscheiden, welche Position ausgewählt werden soll. Quantifizierte Unterschiede werden manchmal als "Effektgrößenanalyse" bezeichnet. Eine Websuche danach sollte einige Ressourcen aufdecken. Kosten und Nutzen fallen unter die Überschrift Gebrauchstheorie und Entscheidungstheorie; wieder findet eine Suche einige Ressourcen.

Robert Dodier
quelle
2

Die (logarithmische) Dezibel-Skala ist nützlich, da die Leistung eines Signals häufig durch eine (variable) Reihe (oder einen Fluidbereich) von Multiplikationen beschrieben werden kann.

  • ZB wenn eine 1cm dicke Wand das Signal auf reduziert110
  • dann 1100
  • und 11000
  • etc.

Wenn Sie die Wandstärke nicht diskret machen, kann das Signal (wenn Sie es in nicht transformierten Einheiten ausdrücken) allgemeiner durch eine Exponentialfunktion P [ m W ] = P 0 ( ausgedrückt werden)

P[mW]=P0(110)L[cm]

Dies ist einfacher, wenn Sie den Logarithmus der Signalleistung als lineare Funktion ausdrücken (die, wenn Sie dies wünschen, eine Definition der absoluten Skala erfordert, in diesem Fall bezieht sich 0 dB auf 1 mW).

P[dB]=10(log(P0[mW])L[cm])

Wann immer Sie einen multiplikativen Prozess haben wie:

XeY

Y

YN(μ,σ2)

Xlog(X) (oder X ausgedrückt in einer anderen logarithmischen Skala, wie der dB-Skala) hat eine Normalverteilung.


Ich gehe davon aus, dass Ihr Fehlerterm so multiplikativ sein wird . Das heißt: Die Signalstärke ist eine Summe vieler normalverteilter Fehlerterme (z. B. Temperaturschwankungen des Verstärkers, atmosphärische Bedingungen usw.), die im Exponenten auftreten des Ausdrucks für die Signalstärke auftreten.

yi=exi+ϵi
Sextus Empiricus
quelle