Gibt es irgendetwas Bedeutendes an einem geometrischen Mittelwert und einem arithmetischen Mittelwert, die sehr nahe beieinander liegen, sagen wir ~ 0,1%? Welche Vermutungen lassen sich über einen solchen Datensatz anstellen?
Ich habe gerade an der Analyse eines Datensatzes gearbeitet und merke, dass die Werte ironischerweise sehr, sehr nahe beieinander liegen. Nicht genau, aber nah. Auch eine schnelle Überprüfung der arithmetischen Mittelwert-geometrischen Mittelwert-Ungleichung sowie eine Überprüfung der Datenerfassung zeigen, dass die Integrität meines Datensatzes in Bezug auf die Art und Weise, in der ich auf die Werte gekommen bin, nichts faul ist.
descriptive-statistics
mean
geometric-mean
user12289
quelle
quelle
x=c(-5,-5,1,2,3,10); prod(x)^(1/length(x))
[1] 3.383363
(während das arithmetische Mittel 1 ist)Antworten:
Das arithmetische Mittel bezieht sich auf das geometrische Mittel durch die Ungleichung Arithmetic-Mean-Geometric-Mean (AMGM), die besagt, dass:
Wobei Gleichheit erreicht wird, wenn . Wahrscheinlich sind Ihre Datenpunkte also alle sehr nah beieinander.x1=x2=⋯=xn
quelle
Eine Möglichkeit, die AMGM-Ungleichung zu erkennen, besteht darin, die Antwort von @Alex R als Jensens Ungleichungseffekt zu betrachten. Durch Jensens Ungleichung : Nehmen Sie dann das Exponential beider Seiten: 1
Die rechte Seite ist das geometrische Mittel, da(x1⋅x2⋅…⋅xn)1/n=exp(1n∑ilogxi)
Wann gilt die AMGM-Ungleichung mit nahezu Gleichheit? Wenn der Ungleichungseffekt des Jensen gering ist. Was hier den Ungleichungseffekt des Jensen antreibt, ist die Konkavität, die Krümmung des Logarithmus. Wenn sich Ihre Daten auf einen Bereich verteilen, in dem der Logarithmus gekrümmt ist, ist der Effekt groß. Wenn sich Ihre Daten auf eine Region verteilen, in der der Logarithmus grundsätzlich affin ist, ist der Effekt gering.
Wenn zum Beispiel die Daten wenig variieren und in einer ausreichend kleinen Nachbarschaft zusammengewürfelt sind, sieht der Logarithmus wie eine affine Funktion in dieser Region aus (ein Thema der Berechnung ist, dass, wenn Sie auf eine glatte, kontinuierliche Funktion genug zoomen, diese es wird wie eine Linie aussehen). Für Daten, die nahe genug beieinander liegen, liegt das arithmetische Mittel der Daten nahe am geometrischen Mittel.
quelle
Untersuchen wir den Bereich von , da ihr arithmetisches Mittel (AM) ein kleines Vielfaches von 1 + δ ihres geometrischen Mittels (GM) ist (mit δ ≥ 0 ). In der Frage ist δ ≈ 0.001, aber wir kennen n nicht .x1≤x2≤⋯≤xn 1+δ δ≥0 δ≈0.001 n
Da sich das Verhältnis dieser Mittel nicht ändert, wenn die Maßeinheiten geändert werden, wählen Sie eine Einheit, für die der GM . Daher versuchen wir, x n unter der Bedingung zu maximieren , dass x 1 + x 2 + ≤ + x n = n ( 1 + δ ) und x 1 ≤ x 2 ≤ x n = 1 .1 xn x1+x2+⋯+xn=n(1+δ) x1⋅x2⋯xn=1
Dies wird erreicht, indem und x n = z ≥ x gesetzt werden . Somitx1=x2=⋯=xn−1=x xn=z≥x
und
Die Lösung ist eine Wurzel zwischen 0 und 1 vonx 0 1
Es ist leicht iterativ zu finden. Hier sind die Graphen des optimalen und z als Funktion von δ für n = 6 , 20 , 50 , 150 von links nach rechts:x z δ n=6,20,50,150
Sobald eine nennenswerte Größe erreicht, stimmt auch ein winziges Verhältnis von 1,001 mit einem großen äußeren x n (den oberen roten Kurven) und einer Gruppe von dicht gebündelten x i (den unteren blauen Kurven) überein .n 1.001 xn xi
Angenommen, im anderen Extrem ist gerade (der Einfachheit halber). Der minimale Bereich ist erreicht, wenn die Hälfte von x i gleich einem Wert x ≤ 1 und die andere Hälfte gleich einem anderen Wert z ≥ 1 ist . Nun ist die Lösung (die leicht zu überprüfen ist)n=2k xi x≤1 z≥1
Ähnliche, ebenso einfach durchzuführende Analysen können Sie - quantitativ - darüber informieren, wie eng das gruppiert istich Dies kann in Form eines anderen Maßes für die Streuung erfolgen, wie z. B. ihrer Varianz oder ihres Variationskoeffizienten.
quelle