Unter welchen Umständen möchten oder möchten Sie eine Variable vor der Modellanpassung skalieren oder standardisieren? Und welche Vor- / Nachteile hat die Skalierung einer Variablen?
56
Unter welchen Umständen möchten oder möchten Sie eine Variable vor der Modellanpassung skalieren oder standardisieren? Und welche Vor- / Nachteile hat die Skalierung einer Variablen?
Antworten:
Bei der Standardisierung dreht sich alles um die Gewichtung verschiedener Variablen für das Modell. Wenn Sie die Standardisierung "nur" aus Gründen der numerischen Stabilität durchführen, kann es Transformationen geben, die sehr ähnliche numerische Eigenschaften ergeben, aber eine andere physikalische Bedeutung haben, die für die Interpretation viel geeigneter sein könnte. Gleiches gilt für die Zentrierung, die in der Regel Bestandteil der Normung ist.
Situationen, in denen Sie wahrscheinlich standardisieren möchten:
Situationen, in denen Sie möglicherweise nicht standardisieren möchten:
Sie können etwas "dazwischen" tun und die Variablen transformieren oder die Einheit so wählen, dass die neuen Variablen immer noch physikalische Bedeutung haben, aber die Variation des numerischen Werts nicht so unterschiedlich ist, z
Ähnlich für die Zentrierung:
quelle
Vor dem Standardisieren frage ich mich immer: "Wie interpretiere ich die Ausgabe?" Wenn es eine Möglichkeit gibt, Daten ohne Transformation zu analysieren, ist dies möglicherweise aus rein interpretatorischer Sicht vorzuziehen.
quelle
Im Allgemeinen empfehle ich keine Skalierung oder Standardisierung, es sei denn, dies ist unbedingt erforderlich. Der Vorteil oder die Attraktivität eines solchen Prozesses besteht darin, dass, wenn eine erklärende Variable eine völlig andere physikalische Dimension und Größe als die Antwortvariable hat, die Skalierung durch Division durch Standardabweichung hinsichtlich der numerischen Stabilität hilfreich sein kann und es ermöglicht, Effekte über mehrere zu vergleichen erklärende Variablen. Bei der gängigsten Standardisierung ist der Variableneffekt das Ausmaß der Änderung der Antwortvariablen, wenn die erklärende Variable um eine Standardabweichung zunimmt. es zeigt auch an, dass die Bedeutung des Variableneffekts (der Änderungsbetrag in der Antwortvariablen, wenn die erklärende Variable um eine Einheit zunimmt) verloren gehen würde, obwohl der statistische Wert für die erklärende Variable unverändert bleibt. Jedoch, Wenn die Interaktion in einem Modell berücksichtigt wird, kann die Skalierung selbst für statistische Tests sehr problematisch sein, da eine stochastische Skalierungsanpassung bei der Berechnung des Standardfehlers des Interaktionseffekts eine Komplikation darstellt (Preacher, 2003). Aus diesem Grund wird eine Skalierung mit Standardabweichung (oder Standardisierung / Normalisierung) im Allgemeinen nicht empfohlen, insbesondere wenn es sich um Interaktionen handelt.
Preacher, KJ, Curran, PJ, und Bauer, DJ, 2006. Computertools zur Untersuchung von Interaktionseffekten in multipler linearer Regression, Mehrebenenmodellierung und Latentkurvenanalyse. Journal of Educational and Behavioral Statistics, 31 (4), 437-448.
quelle