Warum sind Distributionen wichtig?

10

Dies mag genauso gut fallen wie die albernsten Fragen, die jemals in diesem Forum gestellt wurden, aber nachdem ich fundierte und aussagekräftige Antworten auf eine frühere Frage erhalten hatte, dachte ich, ich werde mein Glück wieder strecken.

Ich bin seit einiger Zeit sehr verwirrt über die Bedeutung statistischer Verteilungen, insbesondere in Bezug auf die Rendite von Vermögenswerten und insbesondere auf die Asset Allocation.

Um genau zu sein, lautet meine Frage: Angenommen, ich habe 20 Jahre monatliche S & P 500-Renditedaten. Warum sollte ich für meine Asset-Allokationsentscheidung eine bestimmte Verteilung (z. B. Normal- / Johnson- / Levy-Flug usw.) annehmen müssen, wenn ich dies einfach kann? Treffen Sie meine Asset Allocation-Entscheidungen einfach auf der Grundlage der historischen Daten, die ich bei mir habe.

Stammbaum
quelle
3
Denken Sie daran, dass Sie, wenn Sie Antworten auf Ihre vorherige Frage hilfreich fanden, diese als "akzeptiert" markieren können, indem Sie auf das Kontrollkästchen neben der Antwort klicken. Dadurch wissen andere, dass Ihre Frage gelöst ist.
Jeff
2
Es gibt tatsächlich einen aktuellen Beitrag von JDCook zu diesem Thema. Um die Relevanz für Ihre Frage zu skizzieren, zitiere ich aus dem ersten Absatz: "Wenn Statistiker Daten analysieren, betrachten sie nicht nur die Daten, die Sie ihnen bringen. Sie berücksichtigen auch hypothetische Daten, die Sie hätten bringen können. Mit anderen Worten Sie überlegen, was hätte passieren können und was tatsächlich passiert ist. "
user603
Ich glaube, Taleb hatte etwas Überzeugendes über die Probleme zu sagen, Entscheidungen ausschließlich aus historischen Daten zu treffen :-). (Historische Daten enthüllen normalerweise nicht direkt die seltenen, aber möglicherweise tödlichen "Black Swan"
-Ereignisse,
2
... wie die meisten Truthähne in ein paar Wochen feststellen werden.
Ryogi
Um den Punkt von @ user603 zu erweitern, möchten Sie Schlussfolgerungen außerhalb Ihrer Stichprobe ziehen. Insbesondere bezieht sich der Punkt Ihrer Asset-Allokation auf das zukünftige Verhalten, nicht auf das vergangene Verhalten. Dazu gehört beispielsweise, wie sich die Dinge im Schwanz verhalten, wo Sie nur wenige Beobachtungen haben. Sie können zusätzliches Wissen / Verständnis / Vorurteile über den Prozess über Verteilungsannahmen einbringen. Wenn diese Annahmen nahe beieinander liegen, können Sie viele Informationen hinzufügen.
Glen_b -State Monica

Antworten:

5

Die Verwendung einer angenommenen Verteilung (dh einer parametrischen Analyse) reduziert den Rechenaufwand Ihrer Methode. Ich gehe davon aus, dass Sie eine Regressions- oder Klassifizierungsaufgabe ausführen möchten. Dies bedeutet, dass Sie irgendwann die Verteilung einiger Daten schätzen werden. Nichtparametrische Methoden sind nützlich, wenn die Daten nicht einer gut untersuchten Verteilung entsprechen, sie jedoch in der Regel entweder mehr Zeit zum Berechnen oder mehr Speicher zum Speichern benötigen.

Auch wenn die Daten von einem Prozess generiert werden, der einer Verteilung entspricht, z. B. ein Durchschnitt einiger gleichmäßig zufälliger Prozesse, ist die Verwendung dieser Verteilung sinnvoller. Im Fall der Mittelung eines Satzes einheitlicher Variablen ist die korrekte Verteilung wahrscheinlich die Gaußsche Verteilung.

James
quelle
0

Ergänzende James- Antwort: Parametrische Modelle erfordern (normalerweise) auch weniger Stichproben, um eine gute Anpassung zu erzielen. Dies kann ihre Generalisierungskraft erhöhen. Das heißt, sie können neue Daten besser vorhersagen und sogar falsch liegen. Dies hängt natürlich von der Situation, den Modellen und den Stichprobengrößen ab.

Wahnsinn
quelle