Ich muss Diagramme (ähnlich wie Wachstumsdiagramme) für Kinder im Alter von 5 bis 15 Jahren (nur 5,6,7 usw .; es gibt keine Bruchwerte wie 2,6 Jahre) für eine Gesundheitsvariable erstellen, die nicht negativ, kontinuierlich und in ist der Bereich von 50-150 (mit nur wenigen Werten außerhalb dieses Bereichs). Ich muss 90., 95. und 99. Perzentilkurven erstellen und auch Tabellen für diese Perzentile erstellen. Die Stichprobengröße beträgt ca. 8000.
Ich habe folgende Möglichkeiten geprüft und gefunden:
Finden Sie Quantile und verwenden Sie dann die Lössmethode, um aus diesen Quantilen eine glatte Kurve zu erhalten. Der Grad der Glätte kann über den Parameter 'span' eingestellt werden.
Verwenden Sie die LMS-Methode (Lambda-Mu-Sigma) (z. B. Gamlss- oder VGAM-Pakete in R).
Verwenden Sie die Quantilregression.
Verwenden Sie Mittelwert und SD jeder Altersgruppe, um das Perzentil für dieses Alter zu schätzen und Perzentilkurven zu erstellen.
Was ist der beste Weg, um es zu tun? Mit "am besten" meine ich entweder die ideale Methode, die die Standardmethode für die Erstellung solcher Wachstumskurven ist und für alle akzeptabel wäre. Oder eine einfacher und einfacher zu implementierende Methode, die einige Einschränkungen aufweisen kann, aber eine akzeptable, schnellere Methode ist. (Zum Beispiel ist die Verwendung von Löss für Perzentilwerte viel schneller als die Verwendung von LMS des gamlss-Pakets).
Auch was wird der grundlegende R-Code für diese Methode sein.
Danke für Ihre Hilfe.
Antworten:
Es gibt eine große Literatur zu Wachstumskurven. In meinen Augen gibt es drei "Top" -Ansätze. In allen drei Fällen wird die Zeit als eingeschränkter kubischer Spline mit einer ausreichenden Anzahl von Knoten (z. B. 6) modelliert. Dies ist ein parametrischer Glätter mit hervorragender Leistung und einfacher Interpretation.
quelle
Gaußsche Prozessregression . Beginnen Sie mit dem quadratischen exponentiellen Kernel und versuchen Sie, die Parameter mit dem Auge abzustimmen. Wenn Sie später die Dinge richtig machen möchten, experimentieren Sie mit verschiedenen Kerneln und verwenden Sie die marginale Wahrscheinlichkeit, um die Parameter zu optimieren.
Wenn Sie mehr Details wünschen, als das oben verlinkte Tutorial bietet, ist dieses Buch großartig .
quelle