Ich habe einen monatlichen Durchschnitt für einen Wert und eine Standardabweichung, die diesem Durchschnitt entspricht. Ich berechne jetzt den Jahresdurchschnitt als Summe der Monatsdurchschnitte. Wie kann ich die Standardabweichung für den summierten Durchschnitt darstellen?
Ein Beispiel für die Leistung eines Windparks:
Month MWh StdDev
January 927 333
February 1234 250
March 1032 301
April 876 204
May 865 165
June 750 263
July 780 280
August 690 98
September 730 76
October 821 240
November 803 178
December 850 250
Wir können sagen, dass der Windpark im Durchschnitt 10.358 MWh produziert, aber was ist die Standardabweichung, die dieser Zahl entspricht?
[ASK QUESTION]
oben auf und stellen Sie sie dort. Dann können wir Ihnen richtig helfen. Da Sie neu hier sind, möchten Sie vielleicht an unserer Tour teilnehmen , die Informationen für neue Benutzer enthält.Antworten:
Kurze Antwort: Sie mitteln die Abweichungen ; Dann können Sie die Quadratwurzel ziehen, um die durchschnittliche Standardabweichung zu erhalten .
Beispiel
Und dann ist die durchschnittliche Standardabweichung ist
sqrt(53,964) = 232
Aus der Summe der normalverteilten Zufallsvariablen :
Und aus Wolfram Alphas normaler Summenverteilung :
Für Ihre Daten:
10,358 MWh
647,564
804.71 ( sqrt(647564) )
So beantworten Sie Ihre Frage:
Sie addieren sie quadratisch:
Konzeptionell summieren Sie die Varianzen und berechnen dann die Standardabweichung anhand der Quadratwurzel.
Weil ich neugierig war, wollte ich die durchschnittliche monatliche Durchschnittsleistung und ihre Standardabweichung kennen . Durch Induktion benötigen wir 12 Normalverteilungen, die:
10,358
647,564
Das wären 12 durchschnittliche monatliche Verteilungen von:
10,358/12 = 863.16
647,564/12 = 53,963.6
sqrt(53963.6) = 232.3
Wir können unsere monatlichen Durchschnittsverteilungen überprüfen, indem wir sie zwölfmal addieren, um festzustellen, ob sie der jährlichen Verteilung entsprechen:
863.16*12 = 10358 = 10,358
( richtig )53963.6*12 = 647564 = 647,564
( richtig )Edit : Ich habe den Kurzschluss verschoben, um den Punkt oben zu beantworten. Da brauchte ich das heute wieder tun, aber ich wollte ein und überprüfen Sie, dass ich im Durchschnitt der Abweichungen .
quelle
Dies ist eine alte Frage, aber die akzeptierte Antwort ist nicht richtig oder vollständig. Der Benutzer möchte die Standardabweichung über 12-Monatsdaten berechnen, wobei der Mittelwert und die Standardabweichung bereits über jeden Monat berechnet werden. Unter der Annahme, dass die Anzahl der Stichproben in jedem Monat gleich ist, ist es möglich, den Stichprobenmittelwert und die Abweichung über das Jahr aus den Daten jedes Monats zu berechnen. Der Einfachheit halber nehmen wir an, dass wir zwei Datensätze haben:
mit bekannten Werten für den Stichprobenmittelwert und die Stichprobenvarianz: , , , .μx μy σ2x σ2y
Nun wollen wir die gleichen Schätzungen für berechnen
Bedenken Sie, dass , wie berechnet werden:μx σ2x
Um den Mittelwert und die Varianz über die Gesamtmenge abzuschätzen, müssen wir Folgendes berechnen:
Wenn Sie also die Varianz über jede Teilmenge haben und die Varianz über die gesamte Menge möchten, können Sie die Varianzen jeder Teilmenge mitteln, wenn sie alle den gleichen Mittelwert haben. Andernfalls müssen Sie die Varianz des Mittelwerts für jede Teilmenge hinzufügen.
Nehmen wir an, wir produzieren im ersten Halbjahr genau 1000 MWh pro Tag und im zweiten Halbjahr 2000 MWh pro Tag. Dann sind der Mittelwert und die Varianz der Energieerzeugung in der ersten und zweiten Hälfte 1000 und 2000 für den Mittelwert und die Varianz ist 0 für beide Hälften. Nun gibt es zwei verschiedene Dinge, die uns interessieren könnten:
1- Wir wollen die Varianz der Energieerzeugung über das ganze Jahr berechnen : Dann erhalten wir durch Mitteln der beiden Varianz den Wert Null, was nicht korrekt ist, da die Energie pro Tag über das ganze Jahr nicht konstant ist. In diesem Fall müssen wir die Varianz aller Mittelwerte aus jeder Teilmenge addieren. Mathematisch ist in diesem Fall die interessierende Zufallsvariable die Energieerzeugung pro Tag. Wir haben Stichprobenstatistiken über Teilmengen und möchten die Stichprobenstatistiken über einen längeren Zeitraum berechnen.
2- Wir wollen die Varianz der Energieerzeugung pro Jahr berechnen: Mit anderen Worten, wir interessieren uns dafür, wie viel sich die Energieerzeugung von einem Jahr zum anderen ändert. In diesem Fall führt die Mittelung der Varianz zu der richtigen Antwort, die 0 ist, da wir in jedem Jahr genau 1500 MHW im Durchschnitt produzieren. In diesem Fall ist die interessierende Zufallsvariable rechnerisch der Durchschnitt der Energieerzeugung pro Tag, wobei die Mittelung über das ganze Jahr erfolgt.
quelle
Ich glaube, was Sie wirklich interessieren könnte, ist der Standardfehler und nicht die Standardabweichung.
Der Standardfehler des Mittelwerts (SEM) ist die Standardabweichung der Schätzung des Stichprobenmittelwerts eines Populationsmittelwerts. Damit können Sie messen, wie gut Ihre jährliche MWh-Schätzung ist.
Es ist sehr einfach zu berechnen: Wenn Sie Stichproben verwenden, um Ihre monatlichen MWh-Mittelwerte und Standardabweichungen zu ermitteln, berechnen Sie einfach die Standardabweichung, wie von @IanBoyd vorgeschlagen, und normalisieren Sie sie mit der Gesamtgröße Ihrer Stichprobe. Das heißt,s = √n
quelle
Ich möchte noch einmal die Unrichtigkeit eines Teils der akzeptierten Antwort hervorheben. Der Wortlaut der Frage führt zu Verwirrung.
Die Frage hat Average und StdDev von jedem Monat, aber es ist unklar, welche Art von Teilmenge verwendet wird. Ist es der Durchschnitt von 1 Windkraftanlage der gesamten Farm oder der tägliche Durchschnitt der gesamten Farm? Wenn es sich um den Tagesdurchschnitt für jeden Monat handelt, können Sie den Monatsdurchschnitt nicht addieren, um den Jahresdurchschnitt zu erhalten, da sie nicht denselben Nenner haben. Wenn es sich um den Einheitendurchschnitt handelt, sollte die Frage lauten
Anstatt von
Darüber hinaus ist die Standardabweichung oder -varianz der Vergleich mit dem eigenen Durchschnitt des Satzes. Es enthält KEINE Informationen zum Durchschnitt des gesamten Sets.
Das Bild ist nicht unbedingt richtig, vermittelt aber die allgemeine Vorstellung. Stellen wir uns die Leistung von 1 Windpark wie im Bild vor. Wie Sie sehen, hat die "lokale" Varianz nichts mit der "globalen" Varianz zu tun, egal wie Sie diese addieren oder multiplizieren. Sie können die Varianz des Jahres nicht mit einer Varianz von 2 Halbjahren vorhersagen. In der akzeptierten Antwort bedeutet die Division durch 12, um die monatliche Zahl zu erhalten, nichts , während die Summenberechnung korrekt ist . . Von den drei Abschnitten ist der erste und der letzte falsch, der zweite ist richtig.
Auch hier handelt es sich um eine sehr falsche Anwendung. Befolgen Sie diese bitte nicht, da Sie sonst in Schwierigkeiten geraten könnten. Gerade berechnet für die ganze Sache, unter Verwendung der jährlichen / monatlichen Gesamtleistung jeder Einheit als Datenpunkte, abhängig davon, ob Sie eine jährliche oder monatliche Zahl wünschen, sollte dies die richtige Antwort sein. Sie wollen wahrscheinlich so etwas. Das sind meine zufällig generierten Zahlen. Wenn Sie die Daten haben, sollte das Ergebnis in Zelle O2 Ihre Antwort sein.
quelle