Der Beweis für die vom Menschen verursachte globale Erwärmung entspricht dem „Goldstandard“: Wie haben sie das gemacht?

35

Diese Nachricht in einem Reuter-Artikel vom 25.02.2019 ist derzeit in allen Nachrichten enthalten:

Beweis für vom Menschen verursachte globale Erwärmung erreicht "Goldstandard"

[Wissenschaftler] gaben an, die Zuversicht, dass menschliche Aktivitäten die Hitze an der Erdoberfläche ansteigen ließen, habe ein Fünf-Sigma-Niveau erreicht. Ein statistisches Maß bedeutet, dass das Signal nur mit einer Wahrscheinlichkeit von eins zu einer Million auftreten würde, wenn es eines gäbe keine Erwärmung.

Ich glaube, dies bezieht sich auf diesen Artikel "Feier des Jubiläums der drei Schlüsselereignisse der Klimawandelwissenschaft", der eine Handlung enthält, die im Folgenden schematisch dargestellt ist (Es ist eine Skizze, weil ich kein Open-Source-Bild für ein ähnliches Original gefunden habe freie bilder finden sie hier ). Ein anderer Artikel aus derselben Forschungsgruppe, der eine originellere Quelle zu sein scheint, ist hier (aber er verwendet eine 1% ige Signifikanz anstelle von ).5σ


Das Diagramm zeigt Messungen aus drei verschiedenen Forschungsgruppen: Fernerkundungssysteme, das Zentrum für Satellitenanwendungen und -forschung und die Universität von Alabama in Huntsville.

Das Diagramm zeigt drei ansteigende Kurven des Signal-Rausch-Verhältnisses als Funktion der Trendlänge.

anthropogenes Signal

Irgendwie haben Wissenschaftler ein anthropogenes Signal der globalen Erwärmung (oder des Klimawandels?) Auf einem Niveau gemessen , was anscheinend ein wissenschaftlicher Beweisstandard ist .5σ

Für mich wirft eine solche Grafik mit einem hohen Abstraktionsgrad viele Fragen auf , und im Allgemeinen frage ich mich , wie sie das gemacht haben. . Wie erklären wir dieses Experiment in einfachen Worten (aber nicht so abstrakt) und erklären auch die Bedeutung der Ebene?5σ

Ich stelle diese Frage hier, weil ich keine Diskussion über das Klima haben möchte. Stattdessen möchte ich Antworten zum statistischen Inhalt und insbesondere zur Klärung der Bedeutung einer solchen Aussage, die verwendet / beansprucht .5σ


Was ist die Nullhypothese? Wie haben sie das Experiment vorbereitet, um ein anthropogenes Signal zu erhalten? Wie groß ist der Effekt des Signals? Ist es nur ein kleines Signal und wir messen es jetzt nur, weil das Rauschen abnimmt oder das Signal zunimmt? Welche Annahmen werden getroffen, um das statistische Modell zu erstellen, mit dem das Überschreiten einer 5-Sigma-Schwelle (Unabhängigkeit, zufällige Effekte usw.) bestimmt wird? Warum sind die drei Kurven für die verschiedenen Forschungsgruppen unterschiedlich, haben sie unterschiedliches Rauschen oder unterschiedliche Signale, und was bedeutet das für die Interpretation von Wahrscheinlichkeit und äußerer Gültigkeit?

Sextus Empiricus
quelle
2
@MattF. Meine Erwartung ist, dass es möglich sein wird, eine einfache Darstellung zu machen, die das statistische Konzept der hier verwendeten Schwelle erklärt (zumindest die Teilchenphysiker mit hoher Energie, die auch Diskrepanzen / -Effekte verwenden, um das Signal zu beschreiben) Rauschabstand ist bei Ereigniszahlen kein Problem damit). Mit "einfach" meine ich etwas, das nicht im Fachjargon für Klimatologie zu finden ist, das jedoch so raffiniert ist, dass es die Essenz enthält. Angenommen, es wäre etwas, das für professionelle Statistiker und Mathematiker geschrieben wurde, damit sie das hier verstehen können . σ 5 σ5σσ5σ
Sextus Empiricus
1
Um den Kontrast mit der Hochenergiephysik zu betonen: für dieses Feld Statistiker kann verstehen , dass die Ebene im Grunde bedeutungslos ist und die Bar auf hoch gesetzt , da die Berechnung technisch falsch ist (1. den Blick anderswo Effekt 2. falsche Annahmen über den Fehler Verteilung ohne Berücksichtigung systematischer Effekte 3. implizite Durchführung einer Bayes'schen Analyse, „außerordentliche Ansprüche erfordern außerordentliche Beweise“). 5σ
Sextus Empiricus
1
Die Frage ist, inwieweit diese drei Effekte im Fall dieses von Menschenhand hergestellten Artikels zur globalen Erwärmung vorhanden sind. Ich halte es für wichtig, dies deutlich zu machen, um die wissenschaftlichen Behauptungen zu entmystifizieren. Es ist so üblich, nur einige Zahlen in ein Argument zu werfen, damit es rigoros klingt , und die meisten Leute hören auf, es in Frage zu stellen.
Sextus Empiricus
2
Haben Sie diese Kritik gesehen: judithcurry.com/2019/03/01/… ?
Robert Long
2
Zufällig habe ich vor ein paar Tagen diese Papiere gelesen und jetzt ist mir deine neue Prämie aufgefallen. Ich könnte jetzt etwas aufschreiben.
Amöbe sagt Reinstate Monica

Antworten:

15

Es geht nicht immer um statistische Tests. Es kann sich auch um Informationstheorie handeln.

Der Ausdruck 5σ ist das, was er sagt: ein Verhältnis von "Signal" zu "Rauschen". Beim Testen von Hypothesen haben wir eine Schätzung eines Verteilungsparameters und einen Standardfehler der Schätzung. Das erste ist ein "Signal", das zweite ist "Rauschen", und das Verhältnis der Statistik zu ihrem Standardfehler ist die Z-Statistik, die T-Statistik, die F-Statistik, wie Sie es nennen.

Trotzdem ist das Signal-Rausch-Verhältnis überall dort nützlich, wo wir Informationen durch Rauschen empfangen / wahrnehmen. Wie der angegebene Link erklärt

Das Signal-Rausch-Verhältnis (oft als SNR oder S / N abgekürzt) ist ein Maß, das in Wissenschaft und Technik verwendet wird, um zu quantifizieren, wie stark das Signal durch Rauschen verfälscht wird.

In unserem Fall ist das "Signal" die gemessene tatsächliche Änderung der Temperatur einiger Schichten der Atmosphäre und das "Rauschen" sind Vorhersagen der Änderung aus den Simulationen ohne die bekannten anthropogenen Einflüsse. Es kommt also vor, dass diese Simulationen eine mehr oder weniger stationäre Temperatur mit einer bestimmten Standardabweichung & sgr; vorhersagten.

Nun zurück zur Statistik. Alle Teststatistiken (z, t, F) sind die Verhältnisse der Schätzung zu ihrem Standardfehler. Wenn wir Statistiker also von so etwas wie S / N hören, denken wir an eine Z-Statistik und statten sie mit der Wahrscheinlichkeit aus. Die Klimatologen tun dies offensichtlich nicht (es gibt keine Erwähnung der Wahrscheinlichkeit irgendwo im Artikel ). Sie stellen einfach fest, dass die Änderung "ungefähr drei- bis achtmal" größer ist als erwartet, das S / N ist 3σ bis 8σ.

In dem Artikel wird berichtet, dass zwei Arten von Simulationen durchgeführt wurden: Eine mit den bekannten anthropogenen Einflüssen, die in das Modell einbezogen wurden, und die andere ohne die bekannten anthropogenen Einflüsse. Die ersten Simulationen ähnelten den gemessenen tatsächlichen Satellitendaten, während die zweiten weit entfernt waren. Ob dies wahrscheinlich ist oder nicht, sagen sie nicht und kümmern sich offensichtlich nicht darum.

Andere Fragen beantworten. Sie haben keine Experimente durchgeführt, sondern Simulationen nach ihren Vorbildern durchgeführt. Es gibt also keine explizite Nullhypothese außer der offensichtlichen, dass die Änderung der erwarteten ähnlich ist (S / N ist 1).

Die Effektgröße des Signals ist ein Unterschied zwischen den tatsächlichen Daten und den Simulationen. Es ist ein Signal, das fünfmal so groß ist wie erwartet (fünfmal so große Variabilität der Temperaturen). Es scheint, dass das Rauschen aufgrund der Menge und möglicherweise Genauigkeit der Messungen abnimmt.

Entgegen unseren Erwartungen an die "echten Wissenschaftler" gibt es kein statistisches Modell, über das wir sprechen könnten, so dass die Frage nach den getroffenen Annahmen nicht eindeutig ist. Die einzige Annahme ist, dass ihre Modelle es ihnen ermöglichen, das Klima vorherzusagen. Dies gilt ebenso wie die Aussage, dass die für die Wettervorhersage verwendeten Modelle solide sind.

Es gibt viel mehr als drei Kurven. Sie sind die Simulationsergebnisse von verschiedenen Modellen. Sie müssen einfach anders sein. Und ja, haben unterschiedliche Geräusche. Das Signal ist, soweit es unterschiedlich ist, eine unterschiedliche Menge von Messungen, deren Messfehler vorliegen und die auch unterschiedlich sein sollten. Was bedeutet das für die Interpretation? Die Wahrscheinlichkeitsinterpretation des S / N ist nicht gut. Die externe Gültigkeit der Befunde ist jedoch gesichert. Sie behaupten lediglich, dass die Klimaveränderungen im Zeitraum von 1979 bis 2011 mit Simulationen vergleichbar sind, wenn die bekannten anthropogenen Einflüsse berücksichtigt werden, und dass sie ungefähr fünfmal größer sind als diejenigen, die durch Simulation berechnet werden, wenn die bekannten anthropogenen Faktoren aus dem Modell ausgeschlossen werden.

Es bleibt also noch eine Frage. Wenn die Klimatologen die Statistiker bitten würden, ein Modell zu erstellen, welches sollte es sein? Meiner Meinung nach etwas im Sinne der Brownschen Bewegung.

Nino Rode
quelle
Also, was macht das "Signal" aus, was ist die Natur des "Rauschens" und welchen unsichtbaren Prozessen können wir es zuschreiben?
Josh
1
@Josh, ich habe vorzeitig die Sendetaste gedrückt. Jetzt kannst du meine vollständige Antwort lesen. Mehr oder weniger, das "Signal" sind die tatsächlichen Messungen und das "Rauschen" sind die Ergebnisse der Simulationen, wenn die bekannten anthropogenen Faktoren aus dem Modell ausgeschlossen werden. Und meiner Meinung nach ist dies sehr unstatistisch ...
Nino Rode
1
nσ
3
@NinoRode Vielleicht fehlt mir etwas, aber da das "Rausch" -Modell ohne anthropogene Einflüsse offensichtlich falsch ist, weil die Durchschnittstemperatur aufgrund empirischer Messungen angestiegen ist , wie liefert dieses Modell eine relevante Basislinie? Da davon ausgegangen wird, dass die Temperaturen zusätzlich zu den anthropogenen Prozessen aufgrund natürlicher Prozesse ( en.wikipedia.org/wiki/Little_Ice_Age ) schwanken , ist dies die Grundlage für die Annahme, dass das "Rausch" -Modell einen Temperaturanstieg von durchschnittlich Null gegenüber dem Nullpunkt aufweisen sollte der Analysezeitraum?
Josh
1
@Scott, das Problem mit dem cleveren Cartoon ist, dass in den Zeitreihen kein Rauschen angezeigt wird, da die Messungen wahrscheinlich nicht verfeinert genug sind, um die Temperatur in einem bestimmten Jahrhundert zu bestimmen, geschweige denn in einem bestimmten Jahr. So sieht es glatt und allmählich aus, bis moderne Messgeräte auf den Markt kommen. In der Strömungsmechanik wäre dies wie ein Vergleich einer augenblicklichen Beobachtung eines Geschwindigkeitsfeldes mit einem Reynolds-gemittelten; Es ist kein angemessener Vergleich. Es sei denn, Sie glauben wirklich, dass die globalen Temperaturen im Wesentlichen keine Flüchtigkeit aufwiesen, bis Greta Thunberg geboren wurde. :)
Josh
11

Vorsichtsmaßnahme: Ich bin kein Experte für Klimatologie, dies ist nicht mein Fachgebiet. Bitte denken Sie daran. Korrekturen sind willkommen.


Die Zahl, auf die Sie sich beziehen, stammt aus einer kürzlich erschienenen Veröffentlichung von Santer et al. 2019, Jubiläum von drei Schlüsselereignissen der Klimawandelwissenschaft aus der Sicht des Naturklimawandels . Es ist keine Forschungsarbeit, sondern ein kurzer Kommentar. Diese Abbildung ist eine vereinfachte Aktualisierung einer ähnlichen Abbildung aus einer früheren wissenschaftlichen Veröffentlichung der gleichen Autoren, Santer et al. 2018, Einfluss des Menschen auf den saisonalen Temperaturzyklus der Troposphäre . Hier ist die Zahl für 2019:

Bildbeschreibung hier eingeben

Und hier ist die Zahl für 2018; Tafel A entspricht der Abbildung von 2019:

Bildbeschreibung hier eingeben

Hier werde ich versuchen, die statistische Analyse hinter dieser letzten Abbildung (alle vier Panels) zu erklären. Das Wissenschaftspapier ist offen zugänglich und gut lesbar. Die statistischen Daten sind wie üblich in den Zusatzmaterialien verborgen. Bevor auf die Statistik als solche eingegangen wird, sind die Beobachtungsdaten und die hier verwendeten Simulationen (Klimamodelle) kurz zu beschreiben.


1. Daten

Die Abkürzungen RSS, UAH und STAR beziehen sich auf Rekonstruktionen der Troposphärentemperatur aus den Satellitenmessungen. Die troposphärische Temperatur wird seit 1979 mit Wettersatelliten überwacht: siehe Wikipedia zu MSU-Temperaturmessungen . Leider messen die Satelliten die Temperatur nicht direkt. Sie messen etwas anderes, woraus die Temperatur abgeleitet werden kann. Darüber hinaus ist bekannt, dass sie unter verschiedenen zeitabhängigen Vorspannungen und Kalibrierungsproblemen leiden. Dies macht die Rekonstruktion der tatsächlichen Temperatur zu einem schwierigen Problem. Mehrere Forschungsgruppen führen diese Rekonstruktion nach etwas unterschiedlichen Methoden durch und erzielen etwas unterschiedliche Endergebnisse. RSS, UAH und STAR sind diese Rekonstruktionen. Wikipedia zitieren,

Satelliten messen keine Temperatur. Sie messen Strahlungsstärken in verschiedenen Wellenlängenbändern, die dann mathematisch invertiert werden müssen, um indirekte Rückschlüsse auf die Temperatur zu erhalten. Die resultierenden Temperaturprofile hängen von Einzelheiten der Methoden ab, die verwendet werden, um Temperaturen aus Strahlungsdichten zu erhalten. Infolgedessen haben verschiedene Gruppen, die die Satellitendaten analysiert haben, unterschiedliche Temperaturtrends erhalten. Zu diesen Gruppen gehören Remote Sensing Systems (RSS) und die University of Alabama in Huntsville (UAH). Die Satellitenserie ist nicht vollständig homogen - die Aufzeichnung besteht aus einer Reihe von Satelliten mit ähnlicher, aber nicht identischer Instrumentierung. Die Sensoren verschlechtern sich mit der Zeit und Korrekturen sind für die Satellitendrift im Orbit erforderlich.

Es gibt viele Debatten darüber, welcher Wiederaufbau zuverlässiger ist. Jede Gruppe aktualisiert ihre Algorithmen von Zeit zu Zeit und ändert dabei die gesamte rekonstruierte Zeitreihe. Aus diesem Grund unterscheidet sich beispielsweise RSS v3.3 von RSS v4.0 in der obigen Abbildung. Insgesamt ist AFAIK es auf dem Gebiet anerkannt , dass die Schätzungen der globalen Oberflächentemperatur sind mehr präziser als die Satellitenmessungen. Entscheidend für diese Frage ist auf jeden Fall, dass von 1979 bis heute mehrere Schätzungen der ortsaufgelösten Troposphärentemperatur vorliegen - dh als Funktion von Breite, Länge und Zeit.

T(x,t)

2. Modelle

Es gibt verschiedene Klimamodelle, mit denen die troposphärische Temperatur simuliert werden kann (auch in Abhängigkeit von Breite, Länge und Zeit). Diese Modelle nehmen die CO2-Konzentration, die Vulkanaktivität, die Sonneneinstrahlung, die Aerosolkonzentration und verschiedene andere äußere Einflüsse als Input und erzeugen die Temperatur als Output. Diese Modelle können für den gleichen Zeitraum (1979 - jetzt) ​​unter Verwendung der tatsächlich gemessenen äußeren Einflüsse betrieben werden. Die Ausgaben können dann gemittelt werden, um eine mittlere Modellausgabe zu erhalten.

Man kann diese Modelle auch ausführen, ohne die anthropogenen Faktoren (Treibhausgase, Aerosole usw.) einzugeben, um eine Vorstellung von nicht-anthropogenen Modellvorhersagen zu erhalten. Beachten Sie, dass alle anderen Faktoren (Sonne / Vulkan / etc.) Um ihre Mittelwerte schwanken, sodass die nicht-anthropogene Modellleistung konstruktionsbedingt stationär ist. Mit anderen Worten, die Modelle erlauben es nicht, dass sich das Klima auf natürliche Weise ändert, ohne dass eine bestimmte äußere Ursache vorliegt.

M(x,t)N(x,t)

z

T(x,t)M(x,t)N(x,t)

T(x,ich)M(x,ich)N(x,ich)ich

  1. Jahresmittel: einfache Durchschnittstemperatur über das ganze Jahr.
  2. Jährlicher saisonaler Zyklus: die Sommertemperatur minus die Wintertemperatur.
  3. xich
  4. Jährlicher saisonaler Zyklus mit abgezogenem globalen Mittelwert: Wie (2), aber erneut abgezogen vom globalen Durchschnitt.

M(x,ich)F(x)

T(x,ich)F(x)

Z(ich)=xT(x,ich)F(x),
βz

W(ich)=xN(x,ich)F(x),
βnOichseβnOichsez-statistik:

z=βVar1/2[βnOichse].

z

z

4. Einige Kommentare

Der erste Fingerabdruck (Panel A) ist meiner Meinung nach der trivialste. Es bedeutet einfach, dass die beobachteten Temperaturen monoton ansteigen, während die Temperaturen unter der Nullhypothese dies nicht tun. Ich glaube nicht, dass man diese komplizierte Maschinerie braucht, um diese Schlussfolgerung zu ziehen. Die Zeitreihe der globalen durchschnittlichen unteren Troposphärentemperatur (RSS-Variante) sieht folgendermaßen aus :

Bildbeschreibung hier eingeben

und klarerweise gibt es hier einen sehr signifikanten Trend. Ich glaube nicht, dass man Modelle braucht, um das zu sehen.

z

z


z

Amöbe sagt Reinstate Monica
quelle
2
(+1) Das ist eine großartige Antwort! Wenn es Ihnen nichts ausmacht: Könnten Sie den Schritt "PCA über Zeitpunkte hinweg" erweitern? Ich verstehe nicht, was dahinter steckt, eine PCA zu machen, anstatt jede Dimension einzeln zu analysieren.
mkt - Setzen Sie Monica
βLärm und den Zusammenhang mit Rauschen in Daten und dem zugrunde liegenden Prinzip von Die Wahrscheinlichkeit verursacht dies (in der Hochenergie-Teilchenphysik ist dies offensichtlicher). Aber diese Antwort wird mir ausreichend helfen.
Sextus Empiricus
1
N(x,ich)F(x)T(x,ich)F(x)N(x,2019)
1
Ja, dieses Zeug kann aus allen möglichen Blickwinkeln diskutiert werden. Ich persönlich bin oft ohne viel Urteil über eine Seite, aber ich mag es, dass die Argumente klar und deutlich sind. Die Berichterstattung über das Klima ist derzeit sehr unscharf.
Sextus Empiricus
1
F(x)