Ich möchte die Korrelation zwischen einer kontinuierlichen (abhängigen Variablen) und einer kategorialen (nominal: Geschlecht, unabhängige Variable) Variablen finden. Fortlaufende Daten werden normalerweise nicht verteilt. Vorher hatte ich es mit dem Spearman's berechnet . Mir wurde jedoch gesagt, dass es nicht richtig ist.
Bei der Suche im Internet habe ich festgestellt, dass der Boxplot eine Vorstellung davon geben kann, inwieweit sie verknüpft sind. Ich suchte jedoch nach einem quantifizierten Wert wie Pearsons Produktmomentkoeffizient oder Spearmans . Können Sie mir bitte helfen, wie das geht? Oder informieren Sie sich, welche Methode angemessen wäre?
Wäre der Punkt-Biserial-Koeffizient die richtige Option?
correlation
categorical-data
descriptive-statistics
biostatistics
spearman-rho
Md. Ferdous Wahid
quelle
quelle
Antworten:
quelle
Ich habe jetzt das gleiche Problem. Bisher hat noch niemand darauf hingewiesen, aber ich untersuche die Punkt-Biserial-Korrelation, die sich aus dem Pearson-Korrelationskoeffizienten zusammensetzt. Es ist gemittelt für eine stetige Variable und eine dichotome Variable.
Lesen Sie kurz: https://statistics.laerd.com/spss-tutorials/point-biserial-correlation-using-spss-statistics.php
Ich benutze R, finde aber, dass SPSS eine großartige Dokumentation hat.
quelle
Es scheint, dass der geeignetste Vergleich darin besteht, die Mediane (wie es nicht normal ist) und die Verteilung zwischen den binären Kategorien zu vergleichen. Ich würde den nicht-parametrischen Mann-Whitney-Test vorschlagen ...
quelle
Für das angegebene Problem kann das Messen der Fläche unter der Kurve einer Empfängerkennlinie hilfreich sein.
Ich bin kein Experte in diesem Bereich und versuche es einfach zu halten. Bitte kommentieren Sie Fehler oder falsche Interpretationen, damit ich sie ändern kann.
Die obige Aussage wird mit der Fläche unter der Kurve berechnet.
Beispiel für eine gute Korrelation (rechts) und eine faire Antikorrelation (links).
quelle
Sie sollten eine lineare Trendalternative zur Unabhängigkeit verwenden. Wenn Sie diesen Weg nicht kennen, können Sie eine Einführung in die kategoriale Datenanalyse auf Seite 41 lesen.
quelle