Ich werfe hier das Problem, wie ich es erhalten habe.
Ich habe zwei Zufallsvariablen. Eines davon ist stetig (Y) und das andere ist diskret und wird als Ordnungszahl (X) angegangen . Ich habe unter die Handlung gesetzt, die ich zusammen mit der Anfrage erhalten habe.
Die Person, die mir die Daten sendet, möchte die Stärke der Assoziation zwischen X und Y messen. Ich suche nach Ideen, die nicht mit Annahmen darüber beladen werden, welcher Prozess die Daten generiert hat. Beachten Sie, dass es nicht darum geht, einen nicht parametrischen Weg zu finden um die Stärke der Beziehung testen (wie im Bootstrap), sondern darum, einen nicht parametrischen Weg zu finden, um sie zu messen .
Auf der anderen Seite ist Effizienz kein Problem, da es viele Datenpunkte gibt.
Antworten:
Per Definition ist die Ordnungsskala das Messgerät, bei dem der wahre Abstand zwischen den Kerben
1 2 3 4
unbekannt ist. Es ist, als würden Sie ein Lineal unter Drogen / Alkohol sehen. Die wahren Entfernungen können beliebig sein. Es könnte sein1 2 3 4
oder1 2 3 4
oder was auch immer. Wir können eine Statistik - wie eine Korrelation - nur berechnen, wenn wir uns für die Entfernungen entscheiden und diese korrigieren.Es gibt auch andere Ansätze. Aber in irgendeiner Weise transformieren wir die Ordnungsskala monoton "um ..." (eine Annahme oder ein Ziel), weil die Ordnungsskala auf unbekannte Weise zu uns verzerrt ist. Radikal gesehen wäre eine andere Entscheidung, zuerst "nüchtern" zu werden und zu entscheiden, dass es entweder nicht verzerrt ist (dh es ist ein Intervall) oder auf bekannte Weise verzerrt ist (kein Intervall ist) oder nominal ist.
Einige asymmetrische Ansätze können die ordinale Regression der ordinalen Variablen durch die andere (Intervall / kontinuierlich) umfassen. Oder lineare Regression des letzteren durch die Ordnungszahl, wobei das Modell, bei dem der Prädiktor als Polynomkontrast verwendet wird (dh als eingegeben wird
b1X + b2X^2 + b3X^3,...
). Die Schwäche dieser Ansätze besteht darin, dass sie asymmetrisch sind: Eine Variable ist abhängig, die andere ist unabhängig.quelle
Wenn Monotonie eine zu strenge Annahme ist, frage ich mich, ob Ansätze, die auf maximalen Informationen basieren, wie die von Reshef (2011, 2013) vorgeschlagenen, die nicht einmal funktionale Beziehungen zwischen annehmenX. Y könnte eher so sein, wie Sie es suchen?
Verweise
Reshef, D., Reshef, Y., Finucane, H., Grossman, S., McVean, G., Turnbaugh, P., Lander, E., Mitzenmacher, M. und Sabeti, P. (2011). Erkennung neuartiger Assoziationen in großen Datenmengen. Science , 334 (6062): 1518–1524.
Reshef, D., Reshef, Y., Mitzenmacher, M. und Sabeti, P. (2013). Gleichheitsanalyse des maximalen Informationskoeffizienten mit Vergleichen . arXiv , 14. August.
quelle