Angenommen, ich habe eine Variable, deren Verteilung zu einem sehr hohen Grad positiv verzerrt ist, so dass das Aufnehmen des Protokolls nicht ausreicht, um es in den Bereich der Verzerrung für eine Normalverteilung zu bringen. Welche Möglichkeiten habe ich derzeit? Was kann ich tun, um die Variable in eine Normalverteilung umzuwandeln?
data-transformation
skewness
Histelheim
quelle
quelle
Antworten:
Es ist sehr einfach, es mit der LL-Funktion zu implementieren, oder wenn Sie ein stat-Paket wie SAS oder MATLAB haben, verwenden Sie deren Befehle: Es ist der Befehl boxcox in MATLAB und PROC TRANSREG in SAS.
Auch in R befindet sich dies im MASS-Paket, function boxcox ().
quelle
Bei positivem Versatz (Schweif befindet sich am positiven Ende der x-Achse) gibt es die Quadratwurzeltransformation, die logarithmische Transformation und die inverse / reziproke Transformation (in der Reihenfolge der zunehmenden Schwere). Wenn die Protokolltransformation nicht ausreicht, können Sie die nächste Transformationsebene verwenden. Box Cox führt alle Transformationen automatisch durch, sodass Sie die beste auswählen können.
quelle
Die meisten Softwarepakete verwenden die Euler-Nummer als Standardprotokollbasis, AKA: natürliches Protokoll. Sie können eine höhere Basisnummer verwenden, um zu stark nach rechts gerichtete Daten zu bereinigen. Wie Sie dies syntaktisch tun, hängt von der von Ihnen verwendeten Software ab.
Wenn Sie die transformierten Werte nach der Schätzung wieder verlassen müssen, ist die Verwendung dieser Methode möglicherweise etwas einfacher, da Sie lediglich einen Exponentialoperator für Ihre Variable mit einer beliebigen Protokollbasis ausführen müssen.
quelle