Visualisierung vieler linksgerichteter Verteilungen

10

Ich habe eine Reihe von linksgerichteten / schwerschwänzigen Distributionen, die ich zeigen möchte. Es gibt 42 Verteilungen über drei Faktoren (markiert als A, Bund Cunten). Außerdem schrumpft die Variation über den Faktor hinweg B.

Das Problem, das ich habe, ist, dass die Verteilungen über die Skala des Ergebnisses (Verhältnis oder Fold-Change) schwer zu unterscheiden sind:

Geben Sie hier die Bildbeschreibung ein

Das Protokollieren der Daten scheint die linke Schiefe zu stark zu betonen und mehr Samples in die Schwänze zu verschieben (wodurch eine Mischung aus Ausreißerpunkten entsteht):

Geben Sie hier die Bildbeschreibung ein

Hat jemand Vorschläge zu anderen Techniken zur Visualisierung dieser Daten?

topepo
quelle
5
Die Protokollierung wird häufig verwendet, um die Rechtsschiefe zu verringern, sodass zu erwarten ist, dass die Linksschiefe erhöht wird. Die exp()Transformation ist umgekehrt, aber das ist hier wahrscheinlich viel zu stark. Quadrieren ist eine mildere Alternative. Sie sagen nicht, welche Stichprobengröße Sie haben. Es ist nicht offensichtlich, dass das Hauptproblem eher die linke Schiefe als einige moderate Ausreißer im linken Schwanz in B1 ist. Gibt es hier keine Wissenschaft, um Licht ins Dunkel zu bringen?
Nick Cox
1
Die Stichprobengröße pro Box-Plot beträgt ungefähr 100. Die Werte sind Beschleunigungen, die durch einen neuen Berechnungsalgorithmus erreicht werden (dh alte Laufzeit / neue Laufzeit). Es gibt Fälle, in denen keine nennenswerte Zeitersparnis erzielt wird, sodass die Verteilungen tendenziell nach links abfallen.
Topepo
Vielen Dank. Die Anzahl der Punkte hinter den Schnurrhaaren scheint dann eher gering zu sein.
Nick Cox
3
Was möchten Sie an diesen Distributionen besser sehen? Die aktuelle Handlung sieht für mich gut aus: C macht, wenn überhaupt, kaum einen Unterschied; höheres B macht engere und niedrigere Verteilungen; & höheres A geht mit höheren Werten.
Gung - Reinstate Monica

Antworten:

0

Nur eine Idee: Wenn Sie die Verteilungen beschreiben können, die Sie mit einer Normalverteilung relativ gut erhalten haben, können Sie zweidimensionale Diagramme erstellen, die den Einfluss von A, Bund Cauf die angepassten Verteilungsparameter zeigen: Mittelwert und Standardabweichung.

Oder Sie versuchen, andere beschreibende Kennzahlen für die Verteilung zu finden, die Sie erhalten haben, und zeigen die Auswirkungen der drei Variablen auf sie.

Wenn Sie feststellen, dass zwei Variablen Wechselwirkungen aufweisen, können Sie ein 3D-Diagramm erstellen. Hoffen wir, dass nicht alle miteinander interagieren. ;)

Elmar Macek
quelle