Ich kann anscheinend keine endgültige Antwort auf meine Frage finden.
Meine Daten bestehen aus mehreren Darstellungen mit gemessenen Mittelwerten zwischen 0,27 und 0,57. In meinem Fall sind alle Datenwerte positiv, aber die Messung selbst basiert auf einem Verhältnis von Reflexionswerten, das von -1 bis +1 reichen kann. Die Diagramme stellen Werte des NDVI dar , einem aus der Ferne abgeleiteten Indikator für die "Produktivität" der Vegetation.
Meine Absicht war es, die Variabilität der Werte in jedem Diagramm zu vergleichen, aber da jedes Diagramm einen anderen Mittelwert hat, habe ich mich für die Verwendung des CV entschieden, um die relative Streuung der NDVI-Werte pro Diagramm zu messen.
Soweit ich weiß, ist es nicht koscher, den Lebenslauf dieser Diagramme zu erstellen, da jedes Diagramm sowohl positive als auch negative Werte haben kann. Warum ist es in solchen Fällen nicht angebracht, den Lebenslauf zu verwenden? Was wären einige praktikable Alternativen (dh ein ähnlicher Test der relativen Streuung, Datentransformationen usw.)?
quelle
Antworten:
Überlegen Sie, was Lebenslauf ist: Verhältnis von Standardabweichung zu Mittelwert. Wenn die Variable jedoch positive und negative Werte haben kann, kann der Mittelwert sehr nahe bei 0 liegen. Daher macht CV nicht mehr das, was es tun soll: Geben Sie einen Eindruck davon, wie groß der SD im Vergleich zum Mittelwert ist.
EDIT: In einem Kommentar sagte ich, wenn Sie der Variablen eine Konstante sinnvoll hinzufügen könnten, wäre der Lebenslauf nicht gut. Hier ist ein Beispiel:
x2 ist einfach x + 10. Ich denke, es ist intuitiv klar, dass sie gleichermaßen variabel sind; aber Lebenslauf ist anders.
Ein Beispiel aus dem wirklichen Leben wäre, wenn x die Temperatur in Grad C und x2 die Temperatur in Grad K wäre (obwohl man dort argumentieren könnte, dass K die richtige Skala ist, da es eine definierte 0 hat).
quelle
Ich betrachte diese als verschiedene Variationsmodelle. Es gibt statistische Modelle, bei denen der Lebenslauf konstant ist. Wo diese arbeiten, kann man einen Lebenslauf melden. Es gibt Modelle, bei denen die Standardabweichung eine Potenzfunktion des Mittelwerts ist. Es gibt Modelle, bei denen die Standardabweichung konstant ist. In der Regel ist ein Konstant-CV-Modell für Verhältnisskalenvariablen eine bessere anfängliche Schätzung als ein Konstant-SD-Modell. Sie können darüber spekulieren, warum dies der Fall ist, möglicherweise basierend auf der Prävalenz multiplikativer und nicht additiver Interaktionen.
Die Modellierung mit konstantem CV ist häufig mit einer logarithmischen Transformation verbunden. (Eine wichtige Ausnahme ist eine nicht negative Antwort, die manchmal Null ist.) Es gibt verschiedene Möglichkeiten, dies zu betrachten. Erstens, wenn der CV konstant ist, sind Protokolle die herkömmliche varianzstabilisierende Transformation. Wenn Ihr Fehlermodell alternativ normal mit der SD-Konstante in der Protokollskala ist, ist der Lebenslauf eine einfache Transformation dieser SD. CV ist ungefähr gleich logarithmischer SD, wenn beide klein sind.
Es gibt zwei Möglichkeiten, die Methoden von stats 101 wie eine Standardabweichung auf die Daten anzuwenden, wie Sie sie erhalten haben, oder (insbesondere wenn es sich um eine Verhältnisskala handelt) auf ihre Protokolle. Sie gehen davon aus, dass die Natur etwas komplizierter sein könnte und dass weitere Studien angebracht sein könnten. Berücksichtigen Sie, was die Leute zuvor mit Ihrer Art von Daten als produktiv empfunden haben.
Hier ist ein Fall, in dem dieses Zeug wichtig ist. Chemische Konzentrationen werden manchmal mit CV zusammengefasst oder in einer logarithmischen Skala modelliert. Der pH-Wert ist jedoch eine logarithmische Konzentration.
quelle