Ich habe einen Mittelwert von 74,10 und eine Standardabweichung von 33,44 für eine Stichprobe mit einem Minimum von 0 und einem Maximum von 94,33.
Mein Professor fragt mich, wie plus eine Standardabweichung das Maximum überschreiten kann.
Ich habe ihr viele Beispiele gezeigt, aber sie versteht es nicht. Ich brauche einen Hinweis, um sie zu zeigen. Es kann sich um ein beliebiges Kapitel oder einen beliebigen Absatz aus einem Statistikbuch handeln, in dem es besonders darum geht.
standard-deviation
mean
references
bounds
maximum
Boyun Omuru
quelle
quelle
Antworten:
Mit Sicherheit kann der Mittelwert plus eins sd die größte Beobachtung übertreffen.
Betrachten Sie die Probe 1, 5, 5, 5 -
es hat Mittelwert 4 und Standardabweichung 2, also ist der Mittelwert + sd 6, einer mehr als das Stichprobenmaximum. Hier ist die Berechnung in R:
Es ist ein weit verbreitetes Ereignis. Dies tritt in der Regel auf, wenn ein Haufen hoher Werte und ein Nachlassen nach links zu verzeichnen sind (dh wenn eine starke linke Schräglage und ein Peak in der Nähe des Maximums vorliegen).
-
Die gleiche Möglichkeit gilt für Wahrscheinlichkeitsverteilungen, nicht nur für Stichproben - der Populationsmittelwert plus die Population sd können den maximal möglichen Wert leicht überschreiten.
Hier ist ein Beispiel für eine Dichte von mit einem maximal möglichen Wert von 1:Beta ( 10 , 12)
In diesem Fall können wir auf der Wikipedia-Seite nach der Beta-Distribution suchen, die besagt, dass der Mittelwert ist:
und die Varianz ist:
(Obwohl wir uns nicht auf Wikipedia verlassen müssen, da sie ziemlich einfach abzuleiten sind.)
Für und wir also einen Mittelwert von und sd , also einen Mittelwert von + sd , mehr als das mögliche Maximum von 1.β = 1α = 10 ≈0,9523≈0,0628≈1,0152β= 12 ≈ 0,9523 ≈ 0,0628 ≈ 1,0152
Das heißt, es ist leicht möglich, einen Wert von mean + sd zu haben, der nicht als Datenwert beobachtet werden kann .
-
In jeder Situation, in der der Modus maximal war, muss die Pearson-Modus-Schiefe nur damit der Mittelwert + sd den Maximalwert überschreitet. Es kann jeden Wert annehmen, positiv oder negativ, so dass wir sehen können, dass es leicht möglich ist.<- 1
-
Ein eng verwandtes Problem treten häufig bei Konfidenzintervallen für ein Binomialverhältnis auf , wobei ein häufig verwendetes Intervall, das normale Approximationsintervall , Grenzwerte außerhalb von erzeugen kann .[ 0 , 1 ]
Betrachten Sie beispielsweise ein normales Annäherungsintervall von 95,4% für den Bevölkerungsanteil der Erfolge in Bernoulli-Studien (Ergebnisse sind 1 oder 0, was Erfolgs- und Misserfolgsereignisse darstellt), wobei 3 von 4 Beobachtungen " " und eine Beobachtung " " sind.01 0
Dann ist die Obergrenze für das Intervallp^+ 2 × 14p^( 1 - p^)---------√= p^+ p^( 1 - p^)-------√= 0,75 + 0,433 = 1,183
Dies ist nur der Stichprobenmittelwert + die übliche Schätzung des SD für das Binomial ... und ergibt einen unmöglichen Wert.
Die übliche Stichprobe sd für 0,1,1,1 ist 0,5 statt 0,433 (sie unterscheiden sich, weil die binomiale ML-Schätzung der Standardabweichung der Division der Varianz durch und nicht durch ). Aber es macht keinen Unterschied - in beiden Fällen übersteigt der Mittelwert + sd den größtmöglichen Anteil.p^( 1 - p^) n n - 1
Diese Tatsache, dass ein normales Approximationsintervall für das Binom "unmögliche Werte" erzeugen kann, wird häufig in Büchern und Aufsätzen vermerkt. Sie haben es jedoch nicht mit Binomialdaten zu tun. Trotzdem ist das Problem - das heißt, + eine Anzahl von Standardabweichungen ist kein möglicher Wert - analog.
-
In Ihrem Fall führt der ungewöhnliche Wert "0" in Ihrer Stichprobe dazu, dass der sd größer wird als der Mittelwert nach unten, weshalb der Mittelwert + sd hoch ist.
-
(Die Frage wäre stattdessen - aus welchen Gründen wäre es unmöglich? -, denn ohne zu wissen, warum jemand das Gefühl hat, es gäbe überhaupt ein Problem. Woran wenden wir uns?)
Logischerweise zeigt man, dass es möglich ist, indem man ein Beispiel gibt, wo es passiert. Das hast du schon getan. Was müssen Sie tun, wenn kein Grund angegeben ist, warum dies anders sein sollte?
Wenn ein Beispiel nicht ausreicht, welcher Beweis wäre akzeptabel?
Es hat wirklich keinen Sinn, einfach auf eine Aussage in einem Buch zu verweisen, da jedes Buch eine fehlerhafte Aussage machen kann - ich sehe sie die ganze Zeit. Man muss sich auf die direkte Demonstration verlassen, dass es möglich ist, entweder einen algebraischen Beweis (man könnte ihn aus dem obigen Beta-Beispiel * konstruieren) oder ein numerisches Beispiel (das Sie bereits angegeben haben), das jeder selbst überprüfen kann .
* whuber gibt die genauen Bedingungen für den Beta-Fall in Kommentaren an.
quelle
Gemäß der Ungleichung von Chebyshev können weniger als k –2 Punkte mehr als k Standardabweichungen entfernt sein. Für k = 1 bedeutet dies, dass weniger als 100% Ihrer Proben mehr als eine Standardabweichung entfernt sein können.
Es ist interessanter, die Untergrenze zu betrachten. Ihr Professor sollte sich mehr wundern, dass es Punkte gibt, die etwa 2,5 Standardabweichungen unter dem Mittelwert liegen. Aber wir wissen jetzt, dass nur etwa 1/6 Ihrer Samples 0 sein kann.
quelle
Das Problem kann darin bestehen, dass Ihre Verteilung keine Normalverteilung ist, von der eine Standardabweichung ausgeht. Ihre Verteilung ist wahrscheinlich verzerrt , daher müssen Sie Ihre Menge zuerst in eine Normalverteilung umwandeln, indem Sie eine geeignete Transformationsfunktion auswählen. Dieser Vorgang wird als Umwandlung in Normalität bezeichnet . Ein solcher Funktionskandidat in Ihrem Fall könnte eine gespiegelte Protokolltransformation sein. Sobald Ihr Gerät einen Normalitätstest besteht , können Sie die Standardabweichung verwenden. Verwenden Sie dann Ihr 1 oder 2σ σ Werte, die Sie mithilfe der Umkehrung Ihrer Transformationsfunktion wieder in Ihren ursprünglichen Datenraum umwandeln müssen. Ich denke, das hat Ihr Professor angedeutet.
quelle
Im Allgemeinen haben wir für die Bernoulli-Zufallsvariable , die den Wert mit der Wahrscheinlichkeit und den Wert mit der Wahrscheinlichkeit annimmt ,X 1 0 < p < 1 0 1 - p
Und wir wollen
Quadrieren Sie beide Seiten, um zu erhalten
In Worten, für jede Bernoullische Zufallsvariable mit der theoretischen Ausdruck hält.E ( X ) + S E ( X ) > max Xp > 1 / 2 E( X) + SE( X) > max X
So wird zum Beispiel für jede iid - Probe, die aus einem Bernoulli mit zum Beispiel entnommen wurde , in den meisten Fällen der Probenmittelwert plus die Probenstandardabweichung den Wert überschreiten , der der beobachtete Maximalwert ist (abgesehen vom Fall eines Alle-Nullen-Beispiel!).1p = 0,7 1
Für andere Verteilungen haben wir in der Ungleichung immer die entgegengesetzte Richtung, zB für ein Uniform gilt immer . Daher gibt es keine allgemeine Regel.E ( U ) + S E ( U ) < max U = bU( a , b ) E( U) + SE( U) < max U= b
quelle