Warum kann ich mit Standardmathematik keine 1,5 Standardabweichungen berechnen?

8

Das Normalverteilungsproblem

Ich verstehe nicht, warum ich nicht einfach 1,5 Standardabweichungen hinzufügen kann, um die Antwort zu erhalten.

Wenn 1 Standardabweichung 10 kg und der Mittelwert 400 kg beträgt, sind 415 kg 1,5 Standardabweichungen.

Also habe ich es so berechnet: .3413 + ((.4772-.3413)/2) = 0.40925

Diese Gleichung nimmt die Hälfte der Differenz zwischen zwei Standardabweichungen und einer Standardabweichung und addiert sie dann zur ersten Standardabweichung.

Warum geht das nicht? Warum muss ich die bereitgestellte Tabelle verwenden?

Ben
quelle
5
Woher haben Sie die Zahlen 0.3413, 0.4772 und 0.3413? Der Grund, warum Sie nicht einfach 1,5 SD hinzufügen können, ist, dass Sie nach dem Bereich unter der Kurve gefragt wurden , für den Sie die normale Tabelle verwenden müssen, die Ihnen solche Bereiche gibt.
mb7744
3
@Ben Das Problem besagt, dass die Standardabweichung 10 beträgt. Es sei denn, Sie meinen, Sie haben einen Wert berechnet, der 1 Standardabweichung entspricht, und einen anderen Wert, der 2 Standardabweichungen entspricht. Aber wenn ja, fragte mb7744 danach.
Jelsema
1
@jelsema ja die rechte Seite von 1 Standardabweichung macht 34,13% der Ergebnisse aus. Die zweite Standardabweichung umfasst 47,72% der Ergebnisse. Da es nur 1,5 Standardabweichungen sind, nehmen wir die Differenz zwischen der ersten Standardabweichung und der zweiten Standardabweichung und erhalten die Hälfte davon, da es nur 1,5 Standardabweichungen sind.
Ben
8
@ Ben, du interpolierst linear. Das ist ungültig, womit ich meine, dass es nicht genau richtig ist, weil die Fläche unter der Kurve (etwa vom Mittelwert) keine lineare Funktion der Anzahl der Standardabweichungen ist; Wenn dies der Fall wäre, wäre die 2-Standardabweichung von 0,4772 doppelt so hoch wie die 1-Standardabweichung von 0,3413, was nicht der Fall ist.
Mark L. Stone
1
Ich möchte 5 Quadrat wissen. Warum kann ich nicht einfach 10 Quadrate (das sind 100) nehmen und halbieren?
user253751

Antworten:

20

Der Grund, warum wir nicht (linear) zwischen 0,3413 und 0,4772 interpolieren können, ist, dass das PDF der Normalverteilung nicht gleichmäßig ist (flach bei einem einzelnen Wert).

Betrachten Sie dieses einfachere Beispiel, in dem wir Geometrie verwenden können, um die Bereiche zu finden.

Geben Sie hier die Bildbeschreibung ein

Die Gesamtfläche des Grundstücks beträgt 1(es ist ein diagonal geschnittenes Quadrat, wobei die beiden Teile zu einem Dreieck neu angeordnet sind). Mit können Base*Height/2wir feststellen, dass die Fläche der Region A 0.5und die Gesamtfläche der Regionen B und C ebenfalls ist 0.5.

Die Flächen von B und C sind jedoch nicht gleich. Der Bereich der Region C ist 0.5*0.5/2 = 0.125, und daher die Fläche der Region B ist 0.375. Obwohl die Bereiche B und C entlang der x-Achse gleich breit sind, haben sie unterschiedliche Bereiche, da die Höhe nicht konstant ist.

Die Normalverteilung, mit der Sie sich in Ihrer Übung befassen, ist ähnlich, jedoch mit einer komplizierteren Funktion für die Höhe anstelle eines einfachen Dreiecks. Aus diesem Grund kann der Bereich zwischen zwei Werten nicht so einfach gelöst werden - daher die Verwendung von Z-Scores und einer Tabelle zum Auffinden von Wahrscheinlichkeiten.

Jelsema
quelle
1
Kann ich die Multiple-Choice-Antwort mithilfe der linearen Interpolation erraten? Da sie so weit voneinander entfernt sind? Ist das eine schlechte Idee?
Ben
2
@ Ben Das ist im Allgemeinen eine großartige Idee. Für diese Art der Manipulation werden Multiple-Choice-Tests erstellt. Die Größe einer Antwort abschätzen zu können, ist eine sehr nützliche Fähigkeit während des gesamten Lebens. Trotzdem ist es auch gut, dass Sie nach diesem Problem fragen und es verstehen, denn im Laufe der Zeit wird es immer mehr Fragen wie diese geben, für die es keine Formel für eine Antwort gibt.
Rhaskett
6
@rhaskett obwohl das Vorhandensein der "keine der oben genannten" Antwort Art dieser Strategie verdirbt.
David Z
@Ben Wenn es Testzeit ist, verwenden Sie natürlich jede Methode, um die richtige Antwort zu erhalten. Ein Problem bei Multiple-Choice-Tests besteht jedoch darin, dass sie Vermutungs- und Überprüfungsstrategien ermöglichen, um die Notwendigkeit zu umgehen, tatsächlich nach einem Wert zu suchen. Auf lange Sicht wird das Vertrauen in diese Strategie Sie mehr verletzen, als es hilft, es sei denn, dies ist Ihre Terminal-Mathematikklasse.
Dean MacGregor
@ DavidZ True. Ich habe diese Option verpasst.
Rhaskett
6

Nur um eine andere Illustration zum gleichen Thema zu liefern ...

Bei Ihrer anfänglichen Berechnung würden Sie die Normalkurve als gleichmäßige Verteilung behandeln. In diesem Fall wäre Ihr anfänglicher Ansatz die korrekte mathematische Berechnung für das doppelt schraffierte Rechteck im folgenden Diagramm (mit unterschiedlichen tatsächlichen Werten), einfach weil Sie es wären in der Lage, die Fläche als einfache lineare Abhängigkeit des Achsenabstands auszudrücken :x

A1.5SD=A2SDA1SD2=heightX2SDX1SD2

Sie möchten jedoch die diagonal schraffierte Fläche unter der Kurve der Gaußschen Verteilung berechnen, die, wie bereits erwähnt, keine lineare Beziehung zum Abstand entlang der Achse beibehält, selbst wenn die Verteilung dreieckig wäre:x

7

Antoni Parellada
quelle
2

Die Formel für die Gaußsche Verteilung lautet:

Gauß-Gleichung

Wobei Sigma = Standardabweichung und Mu = Mittelwert

(aus Wikipedia gestohlen)

Wenn Sie nach dem Bereich fragen, integrieren Sie diese Funktion über den angegebenen Bereich. Dieses Integral hat keine "geschlossene Form" -Lösung: Es gibt keine Möglichkeit, einen Ausdruck mit "normalen" mathematischen Funktionen wie Fakultät, Multiplikation, Exponentiation, Wurzeln usw. zu finden, der diesem Integral entspricht.

Es ist wie bei Logarithmen oder trigonometrischen Funktionen: Sie können keine geschlossene Formgleichung für sie mit anderen algebraischen Funktionen erstellen (Sie können unendliche Reihen verwenden, aber das ist nicht "geschlossen"). Sie verwenden also eine Tabelle (wenn Sie sich retro fühlen, oder einen Taschenrechner, der einfach eine Tabelle hinter den Kulissen verwendet, die in den Prozessor eingebettet ist, als Ausgangspunkt), wenn Sie sie tatsächlich berechnen müssen.

Tatsächlich ist die Parallele zu Logarithmen ziemlich passend: Man kann einen Logarithmus auch durch ein Integral definieren, nämlich ln (x) = Integral von (1 / x) von 0 bis x.

Cleverer Neologismus
quelle
0

Geometrisch .4772 - .3413stellt die Fläche unter dem Diagramm zwischen 1 Standardabweichung und 2 Standardabweichungen dar. Wenn Sie diesen Bereich auf halber Strecke horizontal teilen, ist der Teil links von der Teilung der Bereich zwischen 1 und 1,5 Standardabweichungen, wie Sie möchten. Bis jetzt gut.

Wenn Sie jedoch nehmen, erhalten (.4772 - .3413) / 2Sie die Hälfte der Fläche , aber nicht unbedingt das, wonach Sie gesucht haben. Dies ist jedoch die Fläche, die horizontal auf halber Strecke liegt. Bei diesem Diagramm ist der linke Teil der Teilung nicht die Hälfte der Fläche - die Linie fällt nach unten ab (von links oben nach rechts unten), sodass im linken Teil mehr Platz ist als im rechten Teil. Wenn dieses Diagramm eine gerade horizontale Linie wäre, wäre der Bereich, den Sie teilen, ein Rechteck, und die Hälfte der Fläche wäre wirklich halb so breit.

Rakslice
quelle