Wie summiere ich zwei Variablen auf verschiedenen Skalen?

9

Wenn ich zwei Variablen habe, die zwei unterschiedlichen Verteilungen folgen und unterschiedliche Standardabweichungen haben ... Wie muss ich zwei Variablen transformieren, damit die beiden Ergebnisse, wenn ich sie summiere, nicht von einer volatileren "getrieben" werden?

Zum Beispiel ... Variable A ist weniger flüchtig als Variable B (reicht von 0 bis 3000) und Variable B geht weiter. 300 bis 350.

Wenn Sie einfach die beiden Variablen addieren, wird das Ergebnis offensichtlich von A gesteuert.

user333
quelle

Antworten:

14

Es ist üblich, die beiden Variablen A , B zu standardisieren , um sie auf derselben Skala zu platzieren, indem der Stichprobenmittelwert subtrahiert und durch die Standardabweichung der Stichprobe dividiert wird. Sobald Sie dies getan haben, haben beide Variablen die gleiche Skala in dem Sinne, dass sie jeweils einen Stichprobenmittelwert von 0 und eine Stichprobenstandardabweichung von 1 haben. Somit können sie hinzugefügt werden, ohne dass eine Variable einen unangemessenen Einfluss hat Rahmen.A,B

Das heißt, berechnen

AA¯SD(A),  BB¯SD(B)

A¯,SD(A)A

Makro
quelle
1
Funktioniert dies, wenn Variablen nicht normal verteilt sind?
user333
1
Standardisierung hat nichts mit der Normalverteilung zu tun - es ist lediglich ein Mittel, um die Variablen auf die gleiche Skala zu bringen. Also ja.
Makro
Wenn ich durch sd dividiere und den Mittelwert nicht subtrahiere ... bekomme ich die gleichen Volatilitäten, aber unterschiedliche Bereiche, oder?
user333
Ja - wenn Sie sie nur skalieren (durch die Standardabweichungen dividieren), haben beide die gleiche Varianz, aber ihr Mittelwert und ihr Bereich sind unterschiedlich.
Makro
@Macro Was ist, wenn ich keine Daten habe, sondern nur sequentielle Daten für die Variablen. Die Summe zweier Variablen wirkt also eher wie eine Punktzahl. Ich glaube, dass es einige schlechte Implikationen gibt, wie zum Beispiel Punktzahlen sehr früh in der Sequenz. Kennen Sie einen anderen Weg?
Tintinthong