Verwendung der segmentierten linearen Regression als Beweis für die Grenze der menschlichen Lebensdauer

8

Nature veröffentlichte in diesem Jahr das folgende Papier: Hinweise auf eine Begrenzung der menschlichen Lebensdauer 1 , in denen die Autoren argumentieren , dass "die Ergebnisse stark darauf hindeuten, dass die maximale Lebensdauer des Menschen festgelegt ist und natürlichen Einschränkungen unterliegt".

Eine der statistischen Analysen dieses Papiers wurde bereits an einigen Standorten durchgeführt, einschließlich eines Artikels in der Natur, in dem die Lebensdauer des Menschen um 115 Jahre und die Evidenz für eine Begrenzung einer wirksamen Begutachtung durch Fachkollegen falsch sind , da er in einigen populären Medien aufgetaucht ist.

Die Studie basiert unter anderem auf Daten aus Datenbanken, in denen das jährliche Höchstalter des Todes angegeben ist. Zu ihren Analysen gehört die folgende Abbildung :

http://www.nature.com/nature/journal/v538/n7624/images/nature19793-sf6.jpg

Grundsätzlich argumentieren die Autoren, dass es einen Haltepunkt gibt, und führten daher vor ca. 1995 und danach eine segmentierte Regression durch. Die Regression wird als Beweis für die Grenze der menschlichen Lebensdauer verwendet.

Macht es aber Sinn? Wenn nicht, mit welcher Methode könnten diese Daten besser untersucht werden?

[1] Dong, Xiao, Brandon Milholland und Jan Vijg. "Beweise für eine Begrenzung der menschlichen Lebensdauer." Nature 538,7624 (2016): 257 & ndash; 259.

Firebug
quelle
4
Die lineare Regression für Extrema scheint seltsam ... und sie verwendeten offensichtlich eine diskontinuierliche segmentierte Regression, was ungewöhnlich ist ...
kjetil b halvorsen
3
@kjetilbhalvorsen stimmte zu. Extrema sind bekannte Beispiele für Daten, die ziemlich wild gegen normale Annahmen verstoßen. Ich frage mich, wie sich eine Maximum-Likelihood-Routine für Gumbel-Daten entwickelt hätte ... unter Verwendung der treffend benannten Technik der Überlebensanalyse .
AdamO

Antworten:

2

Lassen Sie uns zunächst die Werte manuell aus der ursprünglichen Abbildung 2 extrahieren und die Daten ohne Farben oder Regressionslinien zeichnen, die unsere erste visuelle Überprüfung der Rohdaten beeinträchtigen.

year <- c(1968, 1970, 1973, 1975, 1978, 1979, 1980, 1981, 1982, 
          1983, 1984, 1985, 1986, 1987, 1988, 1989, 1990, 1991, 
          1992, 1994, 1993, 1995, 1996, 1998, 1997, 1999, 2000, 
          2001, 2002, 2003, 2004, 2005, 2006)
age <- c(111, 111, 112, 111, 111, 110, 111, 113, 113, 113, 111, 
         114, 113, 114, 114, 112, 112, 112, 114, 115, 117, 112, 
         114, 115, 121, 119, 114, 115, 115, 114, 113, 114, 112)

plot(year,age,xlab="Year",
     ylab="Yearly maximum reported age at death (years)", 
     pch=20,cex=2,ylim=c(108,124),xlim=c(1960,2010))

Wir erhalten:

Streudiagramm Alter gegen Jahr

Machen wir dasselbe für die Daten in Abbildung 6 (wie in der obigen Frage dargestellt):

age <- c(113, 109, 109, 110, 113, 109, 110, 111, 111, 111, 
         112, 112, 113, 111, 111, 113, 113, 113, 114, 115, 
         113, 114, 122, 119, 117, 114, 115, 115, 114, 114, 
         115, 116, 115, 115, 114, 114, 116, 116, 117)
year <- c(1954, 1957, 1958, 1958, 1963, 1964, 1965, 1967,
          1968, 1970, 1975, 1972, 1976, 1976, 1977, 1980, 
          1981, 1982, 1984, 1985, 1986, 1987, 1997, 1998, 
          1998, 1999, 2001, 2001, 2002, 2003, 2006, 2006,
          2008, 2007, 2010, 2011, 2011, 2012, 2015)

plot(year,age,xlab="Year",
     ylab="MRAD from GRG", 
     pch=20,cex=2,ylim=c(108,124),xlim=c(1950,2020))

Geben Sie hier die Bildbeschreibung ein

Es scheint, dass ein einfaches lineares Regressionsmodell der natürliche Kandidat wäre, der das von den Autoren vorgeschlagene weniger sparsame Änderungspunktmodell in Frage stellt. In der Tat haben Philipp Berens und Tom Wallis dies getan und ihre erneute Analyse auf github veröffentlicht: https://github.com/philippberens/lifespan

Brandmaier
quelle
1
Sie scheinen einen Fehler gemacht zu haben, als Sie die Werte aus der Abbildung übernommen haben - Daten fehlen seit einigen Jahren.
Scortchi - Monica wieder einsetzen
Hmm ... Laut Berens & Wallis erklärten die Autoren, dass "das" Vermisste "auf die Tatsache zurückzuführen ist, dass die MRAD-Personen jünger waren als Jeanne Calment, die zu dieser Zeit den Rekord für die älteste Person der Welt hielt". Daten über andere Menschen, von denen jeder im Jahr seines Todes am ältesten starb, werden aufgrund des anhaltenden Überlebens eines älteren Menschen weggelassen. Klingt nach einem Rezept für einen Haltepunkt!
Scortchi - Monica wieder einsetzen
2
In der ersten Version des Beitrags hatte ich nur ihre Abbildung 2 aufgenommen. Ich habe Daten aus Abbildung 6 hinzugefügt, in denen wir die diskutierte Lücke sehen können.
Brandmaier
Es tut uns leid! Ich nahm an, dass es die gleiche Zahl wie in der Frage war.
Scortchi - Monica wieder einsetzen
4

±

  1. Das Konzept der natürlichen Lebensdauer steht im Widerspruch zum Übergewicht der Forschung zu Alterung, Genetik und Telomeren.
  2. Ein experimentelles Design zur Bewältigung der natürlichen Lebensdauer des Menschen ist unter Verwendung der "Body on a Chip" -Technologie erforderlich.
  3. 50 Jahre sind im Laufe der Menschheitsgeschichte völlig trivial. In der Vergangenheit gab es viele Punkte, an denen einem Aufwärtstrend der Lebensdauer ein Abwärtstrend folgte.
  4. Daten wie die vorgestellten könnten aus einem nichtlinearen Modell mit Diskontinuitäten und / oder Asymptoten simuliert worden sein, die nicht messbar sind.
  5. Da das Ziel des Modells die Vorhersage ist, sind Verteilungsannahmen und die Korrektheit des Durchschnittsmodells erforderlich, und diese wurden (wie es scheint) weder überprüft noch erfüllt.
AdamO
quelle