Verwenden Sie die mittlere Länge und das mittlere Gewicht, um den mittleren BMI zu berechnen?

13

Ist es gültig, die mittlere Länge ( ) und das mittlere Gewicht ( )) einer bestimmten Population zu verwenden, um den mittleren Body-Mass-Index ( ) für diese Population zu berechnen ?hwBMI=wh2

Sophie Michel
quelle
Die Frage ist nicht so abstrakt (laut Kommentar von @ JoeTaxpayer): Typische reale BMIs (15.0-30.0) werden ohnehin auf 1dp gerundet, wenn also der Fehler im mittleren BMI aufgrund des Verhältnisses der Mittelwerte ~ 0.05 beträgt -0,1 ist mathematisch vernachlässigbar (<1%); Für die meisten realen Verteilungen von (Größe, Gewicht). Wir sprechen nicht über Laurel und Hardy ...
smci

Antworten:

18

Mathematisch ist es nicht so, dass diese notwendigerweise nahe beieinander liegen. Es würde funktionieren, wenn es der Fall wäre, dass aber dies ist im Allgemeinen falsch und in bestimmten Situationen kann es ziemlich weit entfernt sein.E(Y./X2)=E(Y.)/E(X)2

Bei einem ziemlich realistischen Satz von bivariaten Größen- und Gewichtsdaten scheint die Auswirkung jedoch gering zu sein.

Betrachten Sie beispielsweise das Modell für die Größe und das Gewicht eines erwachsenen Mannes in den USA in Brainard and Burmaster (1992) [1]; Dieses Modell ist eine bivariate Norm in Bezug auf Größe und Log (Gewicht), die gut zu den Größen- und Gewichtsdaten passt und es einfach macht, realistische Simulationen zu erhalten. Ein gutes Modell für Frauen ist etwas komplizierter, aber ich erwarte nicht, dass es einen großen Unterschied in der Qualität der BMI-Näherung macht. Ich mache nur die Männchen, weil ein sehr einfaches Modell ganz gut ist.

Wenn man das dortige Modell für männliche Größe und Gewicht in metrische Werte umrechnet und 100.000 bivariate Punkte in R simuliert, bevor man einzelne BMIs und damit den mittleren BMI berechnet, sowie die mittlere Größe auf dem (mittleren Gewicht) -Quadrat berechnet, stellt sich heraus, dass das Ergebnis der mittlere BMI war war (bis zu vier Ziffern) 25,21 und war 25,22, was ziemlich genau aussieht.h¯/w¯2

Betrachtet man die Auswirkung der Variation der Parameter, so scheint es, als wäre die Auswirkung der Verwendung des voreingenommenen Schätzers der Variablenmittelwerte für die Frauen wahrscheinlich etwas größer, aber immer noch nicht substanziell genug, um ein großes Problem zu sein.

Im Idealfall sollte etwas überprüft werden, das näher an der Situation liegt, für die Sie es verwenden möchten, aber es wird wahrscheinlich ziemlich gut.

Für eine typische Situation scheint es daher unwahrscheinlich, dass dies in der Praxis ein großes Problem darstellt.

[1]: Brainard, J. und Burmaster, DE (1992),
"Bivariate Verteilungen für Größe und Gewicht von Männern und Frauen in den Vereinigten Staaten",
Risk Analysis , Vol. 12, Nr. 2, S. 267-275

Glen_b - Setzen Sie Monica wieder ein
quelle
10

Es ist nicht ganz richtig, aber es wird normalerweise keinen großen Unterschied machen.

Angenommen, Ihre Bevölkerung hat Gewichte von 80, 90 und 100 kg und ist 1,7, 1,8 und 1,9 m groß. Dann sind die BMIs 27,68, 27,78 und 27,70. Der Mittelwert der BMIs liegt bei 27,72. Wenn Sie den BMI aus den Mitteln der Gewichte und Höhen berechnen, erhalten Sie 27,78, was ein wenig anders ist, aber normalerweise keinen großen Unterschied machen sollte.

Stephan Kolassa
quelle
Vielen Dank für Ihre Antwort! Das heißt also, dass diese Berechnungsmethode wahrscheinlich für keine statistische Analyse geeignet wäre, richtig?
Sophie Michel
2
Ganz ehrlich, ich würde nicht ganz so weit gehen. In der Statistik werden ohnehin verrauschte Daten verarbeitet, und eine geringfügige Ungenauigkeit bei der Messung von Höhen oder Gewichten würde den Unterschied, den wir hier haben, in den Schatten stellen. Ich würde empfehlen, dass Sie mit den Daten, über die Sie nachdenken, etwas in dieser Richtung simulieren und dann überlegen, ob sich diese winzigen Unterschiede wirklich auf Ihre statistische Analyse auswirken.
Stephan Kolassa
1
"Berechnet man den BMI aus den Mitteln der Gewichte und Höhen, so erhält man 27,78" Das entspricht aber dem Maximum der BMIs! Das Maximum anstelle des Mittelwerts zu erreichen, scheint mir ein großer Unterschied zu sein.
Kumulierung
@Akkumulation - Stephans Argument war tot, aber die Auswahl der Zahlen verdeutlichte die Situation nicht gut. Der BMI für "normal" liegt zwischen 18,5 und 24,9. Die 3 BMIs im Beispiel haben einen niedrigen bis hohen Bereich von 0,1. Ein Unterschied von 1/2% bei diesen Daten ist Rauschen. Der BMI eines 5'8 "Mannes steigt von 27,4 auf 27,5, wenn sein Gewicht von 180 auf 181 steigt. 1 Pfund ist der Unterschied zwischen dem Trinken eines hohen Glases Wasser vor oder nach dem
Betreten
@JoeTaxpayer: Ich denke, Ihr Punkt ist, dass typische BMIs (15.0-30.0) ohnehin auf 1dp gerundet werden. Wenn der Fehler im mittleren BMI aufgrund des Verhältnisses der Mittelwerte <0.05 ist, ist er mathematisch vernachlässigbar. Richtig?
smci
3

Obwohl ich mit den anderen Antworten zustimmen , dass es wahrscheinlich ist , dass diese Methode annähernd den mittleren BMI, würde ich zu Punkt darauf dieses nur eine Annäherung ist.

Ich bin eigentlich geneigt zu sagen, dass Sie die von Ihnen beschriebene Methode nicht verwenden sollten , da sie einfach weniger genau ist. Es ist trivial, BMIs für jede Person zu berechnen und dann den Mittelwert daraus zu ziehen, um den tatsächlichen mittleren BMI zu erhalten.

Hier zeige ich zwei Extreme, bei denen das Gewicht und die Länge gleich bleiben, der durchschnittliche BMI jedoch tatsächlich unterschiedlich ist:

Verwenden Sie den folgenden (matlab) Code:

weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.5, 1.5, 1.5, 1.8, 1.8, 1.8;]; % OUR DATA
length = length.^2;
bmi = weight./length;
scatter(1:size(weight,2), bmi, 'filled');
yline(mean(bmi),'red','LineWidth',2);
yline(mean(weight)/mean(length),'blue','LineWidth',2);
xlabel('Person');
ylabel('BMI');
legend('BMI', 'mean(bmi)', 'mean(weight)/mean(length)', 'Location','northwest');

Wir bekommen: mean_bmi2

Wenn wir die Längen einfach neu ordnen, erhalten wir einen anderen mittleren BMI, während der Mittelwert (Gewicht) / Mittelwert (Länge ^ 2) gleich bleibt:

weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.8, 1.8, 1.8, 1.5, 1.5, 1.5;]; % OUR DATA (REORDERED)
... % rest is the same

meine bmi

Bei Verwendung von realen Daten ist es wahrscheinlich, dass Ihre Methode dem realen mittleren BMI nahe kommt. Warum sollten Sie jedoch eine weniger genaue Methode verwenden?

Außerhalb des Rahmens der Frage: Es ist immer eine gute Idee, Ihre Daten zu visualisieren, damit Sie die Verteilungen tatsächlich sehen können. Wenn Sie zum Beispiel bestimmte Cluster bemerken, können Sie auch in Betracht ziehen, separate Mittel für diese Cluster zu erhalten (z. B. separat für die ersten drei und letzten drei Personen in meinem Beispiel).

Deruijter
quelle
2
"Es ist trivial, den BMI für jede Person zu berechnen und dann den Mittelwert daraus zu ziehen, um den tatsächlichen mittleren BMI zu erhalten." Ja, wenn Sie die Rohdaten haben. Wenn Sie nur zusammenfassende Statistiken für eine Population haben, wie die durchschnittliche Größe und das durchschnittliche Gewicht, dann ist es das Beste, was Sie tun können, einen "Populations-BMI" daraus abzuleiten, und die Frage, wie schlecht eine Annäherung ist, die durchaus gültig ist.
Stephan Kolassa
1
+1 Aggregieren Sie keine Aggregate, wenn Sie die gleiche Art von Antwort erhalten können, mit der Rohdaten aggregiert werden. Es gibt Antworten und Kommentare, die in diesem Fall nur einen geringen / keinen / schlanken / vernachlässigbaren Unterschied machen, aber tun Sie es nicht. Lernen Sie gesunde Praktiken zur Datenanalyse kennen und wenden Sie sie an. Gehen Sie dabei richtig vor.
Stian Yttervik