Was ist falsch an der Hochrechnung?

68

Ich erinnere mich, als Student in Statistikkursen gesessen zu haben, warum Hochrechnung eine schlechte Idee war. Darüber hinaus gibt es eine Vielzahl von Online-Quellen, die dies kommentieren. Es gibt auch eine Erwähnung hier .

Kann mir jemand helfen zu verstehen, warum Extrapolation eine schlechte Idee ist? Wenn ja, wie kommt es, dass Prognosetechniken nicht statistisch ungültig sind?

EIN MANN
quelle
3
@Firebug Mark Twain hatte etwas dazu zu sagen. Die entsprechende Passage wird gegen Ende meiner Antwort unter stats.stackexchange.com/a/24649/919 zitiert .
Whuber
1
@whuber Ich denke, das ist nicht gerade Extrapolation jetzt darüber nachzudenken. Angenommen, wir trainieren und validieren einen Algorithmus ordnungsgemäß, um Daten eine Woche nach Beginn des Features vorherzusagen. Wenn Sie das richtige Resampling durchführen (und abstimmen, wenn Hyperparameter zu optimieren sind), kann ich nicht erkennen, was daran falsch ist. Sie haben eine Antwort, und Sie sollten auch das Vertrauen dieser Antwort kennen. Wenn Sie Ihren Algorithmus nun Woche für Woche trainieren, können Sie nicht erwarten, ein Jahr in der Zukunft genau vorherzusagen. Entschuldigen Sie die mögliche Verwirrung.
Firebug
7
@Firebug Sie müssen sich nicht entschuldigen - Ihre Anmerkungen enthalten nützliche Informationen. Während ich sie lese, schlagen sie vor, dass "Hochrechnen" in einer Prognoseeinstellung mehrere Interpretationen haben kann. Zum einen handelt es sich um eine "Extrapolation" der Zeit. Wenn Sie sich jedoch Standard-Zeitreihenmodelle ansehen, insbesondere solche, bei denen Zeit keine explizite Kovariate ist, sagen sie zukünftige Werte in Bezug auf vorherige Werte voraus . Wenn diese vorherigen Werte innerhalb der Bereiche der vorherigen Werte bleiben, führt das Modell überhaupt keine Extrapolation durch! Darin mag eine Lösung des scheinbaren Paradoxons liegen.
Whuber
7
xkcd.com/605
user253751
2
Ich bin enttäuscht, wie lange es gedauert hat, bis die obligatorische xkcd erschien
Duncan X Simpson

Antworten:

89

Ein Regressionsmodell wird häufig zur Extrapolation verwendet, dh zur Vorhersage der Reaktion auf eine Eingabe, die außerhalb des Bereichs der Werte der Prädiktorvariablen liegt, die zum Anpassen des Modells verwendet wird. Die mit der Extrapolation verbundene Gefahr ist in der folgenden Abbildung dargestellt. Grafik mit extrapolierter Linie nach oben, wobei der "wahre" Wert abnimmt

Das Regressionsmodell ist ein "konstruktionsbedingtes" Interpolationsmodell und sollte nicht für die Extrapolation verwendet werden, es sei denn, dies ist ordnungsgemäß begründet.

Kostia
quelle
1
Dies ist ein schreckliches Beispiel gegen die Extrapolation. Die gerade Regressionslinie passt Datenpunkten viel besser als Ihre kurvige wahre Funktion.
HoraceT
9
"Die geraden Regressionsgeraden passen Datenpunkte viel besser als Ihre kurvige wahre Funktion" Diese Aussage ist falsch. Das RSS für die wahre Regressionsfunktion ist kleiner als RSS für die einfache Regressionslinie,
Kostia
Punkt getroffen und Sie können (sollten) Recht haben. Aus der Menge der Punkte lässt sich jedoch auf keinen Fall auf die wahre Funktion schließen.
HoraceT
27
Genau. Und aus diesem Grund kann eine Extrapolation eine schlechte Idee sein.
Kostia
"Das Regressionsmodell ist" konstruktionsbedingt "ein Interpolationsmodell" -> Ich denke, wir können genau dasselbe Problem mit der Interpolation haben (auch wenn es weniger wahrscheinlich ist)
Metariat
88

Dieser xkcd-Comic erklärt alles.

xkcd comic

Anhand der Datenpunkte, die Cueball (der Mann mit dem Stock) hat, hat er extrapoliert, dass die Frau Ende nächsten Monats "vier Dutzend" Ehemänner haben wird, und diese Extrapolation verwendet, um zum Abschluss des Kaufs der Hochzeitstorte in loser Schüttung zu gelangen.

Edit 3: Für diejenigen von euch, die sagen "er hat nicht genug Datenpunkte", hier ist ein weiterer xkcd-Comic :

xkcd comic

Hier wird die Verwendung des Wortes "nachhaltig" im Laufe der Zeit in einem Semi-Log-Diagramm dargestellt, und durch Extrapolation der Datenpunkte erhalten wir unzumutbare Schätzungen darüber, wie oft das Wort "nachhaltig" in Zukunft vorkommen wird.

Edit 2: Für diejenigen unter Ihnen, die sagen "Sie brauchen auch alle früheren Datenpunkte", noch ein xkcd-Comic: xkcd comic

Hier haben wir alle vergangenen Datenpunkte, aber wir können die Auflösung von Google Earth nicht genau vorhersagen. Beachten Sie, dass dies auch ein Semi-Log-Diagramm ist.

Edit: Manchmal sind sogar die stärksten Korrelationen (in diesem Fall r = 0,9979) einfach falsch.


Wenn Sie ohne weitere Belege extrapolieren, bedeutet ein Verstoß gegen die Korrelation keine Kausalität . eine weitere große Sünde in der Welt der Statistik.

Wenn Sie jedoch X mit Y extrapolieren, müssen Sie sicherstellen, dass Sie X mit nur Y genau vorhersagen können (genug, um Ihre Anforderungen zu erfüllen). Fast immer gibt es mehrere Faktoren als Auswirkung X.

Ich möchte einen Link zu einer anderen Antwort teilen , die dies mit den Worten von Nassim Nicholas Taleb erklärt.

noɥʇʎԀʎzɐɹƆ
quelle
14
xkcd hat einen Witz über jedes mögliche Mathematik- / Statistikproblem, auf das man stoßen könnte, oder?
Ander Biguri
24
Diese Idee könnte genauso gut als Argument gegen die Interpolation verwendet werden: "Letzte Nacht hattest du 0,5 Ehemänner".
JiK
3
@JiK Wenn alles, was Sie wissen, ist, dass sie jetzt eine hat und vor zwei Tagen keine hatte, ist das keine schlechte Schätzung ;-)
Dennis Jaheruddin
9
Nachhaltig nachhaltig nachhaltig nachhaltig nachhaltig nachhaltig nachhaltig nachhaltig. en.wikipedia.org/wiki/…
Meni Rosenfeld
1
mehr xkcd, leute!
noɥʇʎԀʎz16
24

"Vorhersagen sind sehr schwierig, besonders wenn es um die Zukunft geht." Das Zitat wird vielen Menschen in irgendeiner Form zugeschrieben . Ich beschränke mich in der folgenden "Extrapolation" auf "Vorhersage außerhalb des bekannten Bereichs" und in einer eindimensionalen Umgebung auf die Extrapolation von einer bekannten Vergangenheit in eine unbekannte Zukunft.

Also, was ist los mit der Hochrechnung. Erstens ist es nicht einfach, die Vergangenheit zu modellieren . Zweitens ist es schwer zu wissen, ob ein Modell aus der Vergangenheit für die Zukunft verwendet werden kann . Hinter beiden Behauptungen verbergen sich tiefe Fragen zur Kausalität oder Ergodizität, zum Ausreichen von Erklärungsvariablen usw., die durchaus fallabhängig sind. Was falsch ist, ist, dass es schwierig ist, ein einzelnes Extrapolationsschema zu wählen, das in verschiedenen Kontexten ohne viele zusätzliche Informationen gut funktioniert.

X

Anscombe-Quartett

Prognosen können jedoch teilweise korrigiert werden. Neben anderen Antworten können einige Zutaten bei der praktischen Extrapolation hilfreich sein:

  1. Sie können die Proben nach ihrem Abstand (Index gewichtennpfp(n)pn
  2. Sie können mehrere Extrapolationsmodelle verwenden und diese kombinieren oder die besten auswählen ( Combining forecast , J. Scott Armstrong, 2001). In letzter Zeit gab es eine Reihe von Arbeiten zu ihrer optimalen Kombination (ich kann bei Bedarf Referenzen zur Verfügung stellen).

Vor kurzem war ich an einem Projekt zur Extrapolation von Werten für die Kommunikation von Simulationssubsystemen in einer Echtzeitumgebung beteiligt. Das Dogma in diesem Bereich war, dass Extrapolation Instabilität verursachen kann. Wir haben tatsächlich festgestellt, dass das Kombinieren der beiden oben genannten Inhaltsstoffe sehr effizient ist, ohne erkennbare Instabilität (ohne einen formalen Beweis, der noch vorliegt und derzeit geprüft wird ). Und die Extrapolation arbeitete mit einfachen Polynomen mit einem sehr geringen Rechenaufwand, wobei die meisten Operationen im Voraus berechnet und in Nachschlagetabellen gespeichert wurden.

Schließlich ist, wie Extrapolation lustiges Zeichnen nahelegt, der folgende Effekt der linearen Regression:

Spaß mit Liebe und linearer Regression

Laurent Duval
quelle
+1 Schöne Antwort. Laut dieser Website scheint es unwahrscheinlich, dass Bohr es gesagt hat. Es scheint eher ein ungewöhnliches, aber allgemeines dänisches Sprichwort zu sein.
usεr11852 sagt Reinstate Monic
@ usεr11852 Hat er das wohl nicht "jemals gesagt"? Deshalb sagte ich "zugeschrieben", sollte ich vorsichtiger sein?
Laurent Duval
2
Ich habe nie gesagt, was immer passiert ist. Ich habe diesen Kommentar gemacht, da das Sprichwort viel wahrscheinlicher ein dänisches Sprichwort zu sein scheint und es einem bestimmten (extrem emblematischen) Dänen zuzuschreiben scheint, ein bisschen überzählig zu sein - vor allem, da es keine Aufzeichnungen darüber gibt, dass Bohr es sagt. Der ursprüngliche Autor könnte ein ungenannter Fischer sein, der den Fang von morgen kommentiert! Ich bin auf der Suche nach dem kleinen Kerl hier! : D
usεr11852 sagt Reinstate Monic
2
Es ist auch sehr schwer, vergangene Zitatlegenden zu modellieren.
Laurent Duval
3
Die Frage verwendet zweifellos beide Wörter: Der springende Punkt ist, ob "Prognose" als eine Form von "Extrapolation" zu betrachten ist. Ihren einleitenden Kommentaren zufolge scheinen Sie Extrapolation so zu definieren, dass Sie die Vergangenheit als "Modell für die Zukunft" verwenden. Solange Sie keine klaren und eindeutigen Definitionen für jede Frage angeben, könnte Ihre Antwort missverstanden werden.
Whuber
17

Obwohl die Anpassung eines Modells " gut " sein kann, muss die Extrapolation über den Datenbereich hinaus mit Skepsis behandelt werden. Der Grund dafür ist, dass in vielen Fällen die Extrapolation (leider und unvermeidlich) auf nicht testbaren Annahmen über das Verhalten der Daten beruht, die über ihre beobachtete Unterstützung hinausgehen.

XOut

Eine zusätzliche Einschränkung besteht darin, dass viele nicht parametrische Schätztechniken eine native Extrapolation nicht zulassen. Dieses Problem macht sich insbesondere bei der Glättung von Keilen bemerkbar, bei der keine Knoten mehr vorhanden sind, um den eingepassten Keil zu verankern.

Lassen Sie mich betonen, dass Extrapolation alles andere als böse ist. Beispielsweise sind numerische Methoden, die in der Statistik weit verbreitet sind (z. B. das Delta-Quadrat-Verfahren von Aitken und die Richardson-Extrapolation ), im Wesentlichen Extrapolationsschemata, die auf der Idee basieren, dass das zugrunde liegende Verhalten der für die beobachteten Daten analysierten Funktion über die Unterstützung der Funktion hinweg stabil bleibt.

usεr11852 sagt Reinstate Monic
quelle
εΔ2
15

Im Gegensatz zu anderen Antworten würde ich sagen, dass Extrapolation nichts Falsches ist, sofern sie nicht sinnlos verwendet wird. Beachten Sie zunächst, dass Hochrechnung ist :

der Prozess der Schätzung des Werts einer Variablen über den ursprünglichen Beobachtungsbereich hinaus auf der Grundlage ihrer Beziehung zu einer anderen Variablen.

... es ist also ein sehr weiter Begriff, und viele verschiedene Methoden, die von der einfachen linearen Extrapolation über die lineare Regression bis zur polynomialen Regression oder sogar einige fortgeschrittene Zeitreihen-Prognosemethoden reichen , passen zu dieser Definition. Tatsächlich hängen Extrapolation, Vorhersage und Prognose eng zusammen. In Statistiken , die wir oft machen Vorhersagen und Prognosen . Dies ist auch der Link, auf den Sie verweisen:

Ab dem ersten Tag der Statistik haben wir gelernt, dass Extrapolation ein großes Nein ist, aber genau das ist Prognose.

Viele Extrapolationsmethoden werden verwendet, um Vorhersagen zu treffen. Darüber hinaus funktionieren einige einfache Methoden oft recht gut mit kleinen Stichproben. Daher können die komplizierten Methoden bevorzugt werden. Das Problem ist, wie in anderen Antworten bemerkt, wenn Sie die Extrapolationsmethode nicht richtig anwenden.

Beispielsweise zeigen viele Studien, dass das Alter der sexuellen Initiation in westlichen Ländern mit der Zeit abnimmt. Sehen Sie sich eine Handlung an, die sich in den USA unter dem Alter des ersten Geschlechtsverkehrs befindet. Wenn wir blindlings die lineare Regression verwenden, um das Alter des ersten Geschlechtsverkehrs vorherzusagen, würden wir voraussagen, dass es in einigen Jahren unter Null geht (dementsprechend, wenn die erste Ehe und die erste Geburt irgendwann nach dem Tod stattfinden) Ein-Jahres-Prognose, dann würde ich vermuten, dass eine lineare Regression zu ziemlich genauen kurzfristigen Prognosen für den Trend führen würde.

Bildbeschreibung hier eingeben

(Quelle guttmacher.org )

Alle Modelle sind falsch , Extrapolation ist auch falsch, da Sie dadurch keine genauen Vorhersagen treffen können. Wie bei anderen mathematisch / statistischen Tools können Sie damit ungefähre Vorhersagen treffen . Inwieweit sie genau sind, hängt von der Qualität der Daten ab, über die Sie verfügen, und zwar unter Verwendung von Methoden, die für Ihr Problem geeignet sind, von den Annahmen, die Sie bei der Definition Ihres Modells getroffen haben, sowie von vielen anderen Faktoren. Das heißt aber nicht, dass wir solche Methoden nicht anwenden können. Wir können, aber wir müssen uns an ihre Grenzen erinnern und sollten ihre Qualität für ein bestimmtes Problem bewerten .

Tim
quelle
4
Wenn die Daten, die Sie für die Regression verwenden, in den frühen 1980er Jahren enden, können Sie wahrscheinlich leicht testen, wie lange eine Extrapolation nach diesem Datum funktionieren würde.
Gerrit
@gerrit Ich stimme zu, aber leider konnte ich keine passenden Daten finden. Aber wenn mich jemand darauf hinweisen könnte, würde ich gerne meine Antwort für einen solchen Vergleich aktualisieren.
Tim
In diesem Fall schlägt die Hochrechnung fehl, da das Alter des ersten Geschlechts in den letzten Jahren sprunghaft angestiegen ist. (Die Daten hierfür liegen jedoch aus offensichtlichen Gründen immer ein paar Jahrzehnte nach dem Geburtsjahr.)
David Manheim,
13

Ich mag das Beispiel von Nassim Taleb (das eine Adaption eines früheren Beispiels von Bertrand Russell war):

Stellen Sie sich einen Truthahn vor, der jeden Tag gefüttert wird. Jede einzelne Fütterung wird den Glauben des Vogels bekräftigen, dass es die allgemeine Lebensregel ist, jeden Tag von freundlichen Mitgliedern der Menschheit gefüttert zu werden, "die nach ihren besten Interessen Ausschau halten", wie ein Politiker sagen würde. Am Mittwochnachmittag vor Thanksgiving passiert etwas Unerwartetes mit der Türkei. Es wird eine Revision des Glaubens geben.

Einige mathematische Analoga sind die folgenden:

  • Die Kenntnis der ersten paar Taylor-Koeffizienten einer Funktion garantiert nicht immer, dass die nachfolgenden Koeffizienten Ihrem angenommenen Muster folgen.

  • Die Kenntnis der Anfangsbedingungen einer Differentialgleichung garantiert nicht immer die Kenntnis ihres asymptotischen Verhaltens (z. B. Lorenz-Gleichungen, die manchmal in den sogenannten "Schmetterlingseffekt" verzerrt sind).

Hier ist ein netter MO-Thread zu diesem Thema.

J. M. ist kein Statistiker
quelle
3
… Und natürlich muss Taleb auf die moralische Lehre hinweisen: "Sei kein Truthahn"! In diesem Zusammenhang: Seien Sie kein unvorsichtiger Extrapolator und erliegen Sie nicht der Sünde der Hybris.
JM ist kein Statistiker
@ uoɥʇʎPɥʇʎzʎC, ich habe nicht danach gefragt, aber danke!
JM ist kein Statistiker
Ich kann es nicht wirklich gebrauchen, wenn der Ruf einer anderen Person bestätigt wird - und niemand hat Ihre Antwort gesehen, und es war wirklich gut. Genießen!
noɥʇʎԀʎzɥʇʎԀʎ
12

Denken Sie über die folgende Geschichte nach, wenn Sie so wollen.

Ich erinnere mich auch, in einem Statistikkurs gesessen zu haben, und der Professor sagte, Extrapolation sei eine schlechte Idee. Dann sagte er uns in der nächsten Stunde, es sei wieder eine schlechte Idee. Tatsächlich sagte er es zweimal.

Ich war für den Rest des Semesters krank, aber ich war mir sicher, dass ich nicht viel Material verpasst haben konnte, denn bis zur letzten Woche musste der Typ sicherlich nichts anderes getan haben, als den Leuten immer wieder zu erzählen, wie eine Hochrechnung eine schlechte Idee war .

Seltsamerweise habe ich bei der Prüfung nicht sehr gut abgeschnitten.

einpoklum
quelle
6
Die Frage lautet "Was ist mit der Hochrechnung falsch?". Wir suchen nach Antworten, die begründen, warum Extrapolation eine schlechte Idee sein könnte.
Robert Long
8
@RobertLong: Eigentlich ist es eine Art Meta / Witz-Antwort und ziemlich ähnlich wie xkcd.com/605 - aber vielleicht noch besser als Kommentar als als Antwort.
Neil Slater
@NeilSlater: Du hättest deinen Kommentar als Antwort posten sollen ... :)
usεr11852 sagt Reinstate Monic
@RobertLong: Das ist diese Art von Antwort. Es hat einfach die Form einer Parabel.
Einpoklum
2
Es ist nicht klar, dass Ihr Modell exponentiell ist.
Gerrit
6

Die Frage ist nicht nur statistisch, sondern auch erkenntnistheoretisch. Extrapolation ist eine der Arten, wie wir etwas über die Natur lernen. Es ist eine Form der Induktion . Angenommen, wir haben Daten zur elektrischen Leitfähigkeit eines Materials in einem Temperaturbereich von 0 bis 20 Grad Celsius. Was können wir über die Leitfähigkeit bei 40 Grad Celsius sagen?

Dies hängt eng mit der Inferenz kleiner Stichproben zusammen: Was können wir über die gesamte Population aus Messungen an einer kleinen Stichprobe sagen? Dies wurde von Gosset als Guiness begonnen , der Student-T-Distributionen entwickelte. Vor ihm haben sich Statistiker keine Gedanken über kleine Stichproben gemacht, vorausgesetzt, die Stichprobengröße kann immer groß sein. Er war in Guinnes und musste sich mit Bierproben befassen, um zu entscheiden, was mit der gesamten Partie Bier geschehen sollte, um es zu versenden.

In der Praxis (Wirtschaft), im Ingenieurwesen und in den Naturwissenschaften müssen wir also immer in gewisser Weise extrapolieren. Es könnte sein, dass kleine Proben auf große extrapoliert werden oder dass ein begrenzter Bereich von Eingabebedingungen auf einen größeren Bereich von Bedingungen übertragen wird, von dem, was im Beschleuniger vor sich geht, bis zu dem, was in Milliarden von Kilometern Entfernung mit einem Schwarzen Loch passiert ist. Dies ist jedoch in der Wissenschaft besonders wichtig Wie wir wirklich lernen, indem wir die Diskrepanzen zwischen unseren Hochrechnungsschätzungen und den tatsächlichen Messungen untersuchen. Oft finden wir neue Phänomene, wenn die Abweichungen groß oder konsistent sind.

daher sage ich, dass es kein Problem mit der Extrapolation gibt. Das müssen wir jeden Tag tun. Es ist nur schwer.

Aksakal
quelle
4

Extrapolation selbst ist nicht unbedingt böse, aber es ist ein Prozess, der zu Schlussfolgerungen führt, die unvernünftiger sind, als Sie es mit Interpolation erreichen.

  • Eine Extrapolation wird häufig durchgeführt, um Werte zu ermitteln, die weit entfernt von der untersuchten Region liegen. Wenn ich 100 Werte von 0 bis 10 abtaste und dann ein wenig extrapoliere, lediglich auf 11, ist mein neuer Punkt wahrscheinlich zehnmal weiter von einem Datenpunkt entfernt, als eine Interpolation jemals erreichen könnte. Dies bedeutet, dass eine Variable wesentlich mehr Platz hat, um (qualitativ) außer Kontrolle zu geraten. Beachten Sie, dass ich absichtlich nur eine geringfügige Hochrechnung gewählt habe. Es kann noch viel schlimmer werden
  • Die Extrapolation muss mit Kurvenanpassungen erfolgen, die für die Extrapolation vorgesehen sind. Zum Beispiel sind viele Polynomanpassungen für die Extrapolation sehr schlecht, da Terme, die sich gut über den abgetasteten Bereich verhalten, explodieren können, sobald Sie ihn verlassen. Eine gute Extrapolation hängt von einer "guten Vermutung" darüber ab, was außerhalb der Stichprobenregion geschieht. Welches bringt mich zu ...
  • Aufgrund von Phasenübergängen ist es häufig äußerst schwierig, eine Extrapolation durchzuführen. Viele Prozesse, auf die man extrapolieren möchte, weisen entschieden nichtlineare Eigenschaften auf, die über dem Probenbereich nicht ausreichend exponiert sind. Die Luftfahrt mit Schallgeschwindigkeit ist ein hervorragendes Beispiel. Viele Extrapolationen von niedrigeren Geschwindigkeiten fallen auseinander, wenn Sie die Geschwindigkeit der Informationsübertragung in der Luft erreichen und überschreiten. Dies ist auch in den Soft Sciences häufig der Fall, wo sich die Politik selbst auf den Erfolg der Politik auswirken kann. Die keynesianische Ökonomie extrapolierte, wie sich die Wirtschaft bei unterschiedlichen Inflationsraten verhalten würde, und sagte das bestmögliche Ergebnis voraus. Leider gab es Effekte zweiter Ordnung und das Ergebnis war nicht wirtschaftlicher Wohlstand, sondern einige der höchsten Inflationsraten, die die USA je gesehen haben.
  • Leute mögen Hochrechnungen. Im Allgemeinen möchten die Leute wirklich, dass jemand in eine Kristallkugel blickt und ihnen die Zukunft erzählt. Sie werden überraschend schlechte Hochrechnungen akzeptieren, nur weil sie alle Informationen haben, die sie haben. Dies macht die Extrapolation an sich vielleicht nicht schlecht, aber es ist definitiv etwas, das man bei der Verwendung berücksichtigen sollte.

Betrachten Sie für die ultimative Hochrechnung das Manhattan-Projekt. Die dortigen Physiker waren gezwungen, mit extrem kleinen Tests zu arbeiten, bevor sie die reale Sache konstruierten. Sie hatten einfach nicht genug Uran, um es für Tests zu verschwenden. Sie taten das Beste, was sie konnten, und sie waren schlau. Als der letzte Test stattfand, wurde entschieden, dass jeder Wissenschaftler entscheiden würde, wie weit er von der Explosion entfernt sein wollte, als sie losging. Es gab erhebliche Meinungsverschiedenheiten darüber, inwieweit "sicher" ist, da jeder Wissenschaftler wusste, dass er weit von seinen Tests entfernt extrapoliert. Es gab sogar eine nicht triviale Überlegung, dass sie die Atmosphäre mit der Atombombe in Brand setzen könnten, ein Thema, das auch mit erheblicher Extrapolation behoben werden musste!

Cort Ammon
quelle
3

Viele gute Antworten hier, ich möchte nur versuchen, das, was ich als Kern des Problems sehe, zusammenzufassen: Es ist gefährlich, über den Datenerzeugungsprozess hinaus zu extrapolieren, der die Schätzungsstichprobe ausgelöst hat. Dies wird manchmal als "Strukturwandel" bezeichnet.

Für die Prognose werden Annahmen zugrunde gelegt. Die Hauptannahme besteht darin, dass der Datenerzeugungsprozess (so gut wie kein wesentlicher Unterschied besteht) dem entspricht, der die Stichprobe erzeugt hat (mit Ausnahme der rhs-Variablen, deren Änderungen Sie explizit im Modell berücksichtigen). . Wenn eine strukturelle Änderung eintritt (z. B. Thanksgiving in Talebs Beispiel), sind alle Wetten ungültig.

Jason
quelle