In der Statistik stoße ich manchmal auf Symbole, deren Symbol ein "Quadrat" trägt. In anderen Bereichen, wie zum Beispiel der Mechanik, geben Sie die Menge an, die Sie für einen normalen Buchstaben interessiert, und definieren dann Ihre Formeln, sodass Sie sie neu anordnen können, bis die Menge, an der Sie interessiert sind, als normaler Buchstabe auf der linken Seite von steht die Formel. Ein Beispiel ist die Position nach Bewegung für eine Zeit und eine Geschwindigkeit :
In der Statistik befinden sich jedoch manchmal quadratische Mengen auf der linken Seite, da dies für die weitere Interpretation der Ergebnisse verwendet wird:
Die Varianz einer Zufallsvariablen mit dem Erwartungswert E [X] = µ :
Hier steht eine quadratische Entität auf der linken Seite der Formel.
Der Bestimmungskoeffizient , der von Statistikern sogar immer nur als "R im Quadrat" bezeichnet wird. Warum gibst du ihm keinen "normalen" Brief, wenn er so oft verwendet wird?
Die Erblichkeit ist ein Maß, das in der Genetik angewendet wird, wenn das Ausmaß der Variation, die aus der Umwelt stammt, gegenüber dem Ausmaß der Variation, das aus der Genetik stammt, in ein Verhältnis gebracht werden soll. Ein quantitatives Merkmal (z. B. Wachstumshöhe) wird in Abhängigkeit von Genotypeffekt und Umwelteffekt (alle Zufallsvariablen) wie folgt modelliert :
Weitsichtige Erblichkeit ist definiert [src]
Niemand interessiert sich jemals für , nur .
Was ist der Sinn dieser Konvention? Was sagt es Statistikern? Oder gibt es mehrere unabhängige Ursachen?
quelle
Antworten:
Während wir vielleicht die vielen verschiedenen Formeln analysieren, die wir in der Statistik finden, und sehen, dass zweite Momente einen besonderen Platz haben ...
... vielleicht ein spezieller Platz in der Statistik als in der Physik (die auch Platz Begriffe der Einfachheit halber auch gelegentlich verwendet, zum Beispiel ‚Gyrationsradius‘ . Und auch einen Begriff wie ‚ Moment der Trägheit‘ ist weder ein völlig vereinfachten Begriff und enthält Herkunfts es Moment wie statistisch ihren Ursprung enthalten Platz . Hinzu kommt, Physiker wie Einfachheit wie , während Statistiker, gut) ...r2g ℏ=h2π
Die Gründe für diese Verwendung von quadratischen Begriffen (z. B. die leicht als eine "Konstante" anstelle von , wenn Sie nehmen es aus den Klammern) kann aus historischen Gründen leichter gefunden werden .(xσ)2 σ2 σ
Über die Antwort von Nick Cox auf diese frühere Lebenslauffrage Wer ist der Schöpfer oder Erfinder des Bestimmungskoeffizienten (R-Quadrat)? wir sehen, dass die Geschichte einen großen Einfluss auf diesen Begriff hatte. Und dies gilt nicht nur für , der Begriff wird von derselben Person "erfunden". Sehen Sie sich einfach eine Artikelsuche bei Google an:R2 h2
https://scholar.google.com/scholar?q="degree+of+determination"&as_ylo=1918&as_yhi=1924
Sie sehen, dass Sewall Wright bei den ersten Beschreibungen des Konzepts des "Grads der Entschlossenheit" viel getan hat. Er drückte es sowohl als auch als Quadrat von etwas anderem aus 1) Korrelationskoeffizienten und 2) Vererbung oder einen äquivalenten Korrelationskoeffizienten (siehe eine frühere Quelle als von Nick Cox erwähnt: Wright 1920 ) .R2 h2 R h
In einem Artikel wie Mordecai Ezekiel 1929 Bedeutung und Bedeutung von Korrelationskoeffizienten sehen Sie, dass Menschen für eine beträchtliche Zeit alle Arten von Ausdrücken mit dem Korrelationskoeffizienten verwendeten (im spezifischen Beispielartikel: , , , ) abgesehen von , was die explizite Notation von wichtig machte (die Physik bietet diese Wahlfreiheit nicht, wo wir überlegen müssen, welche Art von Moment, erster, zweiter, dritter oder eine Funktion davon oder etwas anderes wie der Median ist am besten, um eine bestimmte Verteilung oder Situation zu beschreiben .r2 r 1−r2−−−−−√ 1−1−r2−−−−−√ r2 r2
In der wunderbaren Übersicht von Wright 1934 schlägt er " die Methode der Pfadkoeffizienten " vor
obwohl die Leute weiterhin die quadratische Definition verwendeten. Wahrscheinlich war diese 'Methode der Pfadkoeffizienten' nicht sehr beliebt, denn wer lehrt / lernt dies heutzutage und welcher andere Statistik-Guru hat diese Definitionen verwendet?
In dieser Übersicht von Wright aus dem Jahr 1934 finden Sie auch einen Verweis auf einen Artikel aus dem Jahr 1918, in dem er Quadrate von Korrelationskoeffizienten verwendet, aber noch keinen Begriff im Zusammenhang mit "Bestimmung".
Dieser Begriff wird sehr oft nicht als solcher verwendet. Und stattdessen wird es verwendet
oder durch den Begriff "Varianz" ersetzt. Ein typischer Ausdruck ist .Var(X)
Ein weiterer vorhandener Ausdruck ist (in älteren Texten weit verbreitet). Der Index gibt die Reihenfolge des Augenblicks an. Also ist (oder besser ) der erste rohe Moment oder der Mittelwert, der Index 2 bedeutet den zweiten Moment (Varianz im Fall des zentralen zweiten Moments), der Index 3 bedeutet den dritten Moment , .... , uswμ2 μ1=μ μ′1=μ
(Ein Problem mit diesem Symbol ist, dass unklar ist, um welchen Punkt der Moment, z. B. zentral oder roh, definiert ist, selbst wenn vs existiert, um zwischen roh und zentral zu unterscheiden. Das Symbol für Mittelwert hat tatsächlich das gleiche Problem, obwohl es sehr Standard geworden ist, so dass die Mehrdeutigkeit in den meisten Fällen nicht so relevant ist)μ2 μ′ μ μ
Nun, dieser große Text unter diesem Artikel erklärt ein wenig, warum für viele Wissenschaftler und Statistiker möglicherweise einfacher ist. Auch wie bei und gibt es einen historischen Ursprung. Interessante liest:σ2 h2 R2
Laut Wikipedia (19. Oktober 2017) verwendete Fisher zuerst den Begriff "Varianz".
Wenn Sie den Artikel lesen, sehen Sie, dass er die Varianz häufig auf die linke Seite der Gleichung setzt und sie mit einem Buchstaben . Die Verwendung eines Buchstabens ist heutzutage in Arbeiten zur mathematischen Statistik noch immer üblich. In diesem Artikel verwendet er oft , aber das ist der Einfachheit halber. Stellen Sie sich den Satz von Fermat vor, der mit einem Term wie anstelle von . Auf diese Weise wird durch die Einfachheit der Gleichungen die Verwendung von verstärkt. Beachten Sie, dass das Ersetzen von durch nicht immer sinnvoll ist. Manchmal möchte man angeben, dass es sich bei der Berechnung umV V σ2 c=an+bn−−−−−−√n cn=an+bn σ2 σ2 V σ2 . Zum Beispiel ist die Gleichung 1 im Artikel 1918 klarer als , wenn das , worum es geht, explizit in die Gleichung geschrieben wird.σ2=∑a2 V=∑a2 σ
Vor Fisher wird die Variabilität erwähnt : 1916 beschreibt James Johstone ( DIE MATHEMATISCHE THEORIE DER ORGANISCHEN VARIABILITÄT ) ein Konzept der Variabilität in Bezug auf die Gaußsche Verteilung. In Bezug auf die ‚Abweichung im Quadrat‘ oder ‚quadratische Abweichung‘ finden Sie mehrere frühere Quellen finden. Eine interessante Referenz unter den frühen Verwendungen der "quadratischen Abweichung" ist Francis Ysidro Edgeworth (1917), der in einer Fußnote von "Fluktuation" anstelle von " spricht .σ2
quelle
IeS Erblichkeit bezeichnet ist , weil die Menschen (nicht sicher , wer aber sehe Felsenstein, 2016, Kap. IX, Problem 7) zunächst das Symbol eingeführt für die Korrelation zwischen dem additiven genetischen Effekt und dem Phänotyp , Wenn die additive Komponente und der Phänotyph2 h x z=x+e
quelle