Wie konvertiere ich standardisierte Koeffizienten in nicht standardisierte Koeffizienten?

Mein Ziel ist es, die Koeffizienten, die aus früheren Untersuchungen zu diesem Thema abgeleitet wurden, zu verwenden, um die tatsächlichen Ergebnisse anhand einer Reihe unabhängiger Variablen vorherzusagen. Das Forschungspapier listet jedoch nur die Beta-Koeffizienten und den t-Wert auf. Ich würde gerne wissen, ob es möglich ist, die standardisierten Koeffizienten in nicht standardisierte umzuwandeln.

Wäre es nützlich, meine nicht standardisierten unabhängigen Variablen in standardisierte umzuwandeln, um den vorhergesagten Wert zu berechnen? Wie würde ich zu einem nicht standardisierten vorhergesagten Wert zurückkehren (wenn das überhaupt möglich ist ..)

Beispielzeile aus Papier hinzugefügt :

Anzahl der Buslinien (Buslinien) | 0,275 (Beta) | 5,70 *** (t-Wert)

Dies wird mir auch in Bezug auf die unabhängigen Variablen gegeben:

Anzahl der Buslinien (Buslinien) | 12,56 (Durchschnitt) | 9.02 (Std) | 1 (min) | 53 (max)

regression-coefficients
quelle

Wie wurden die Koeffizienten standardisiert? Im Allgemeinen haben die

eine Einheit, die die Einheit von

geteilt durch die Einheit von

ist. Was ist ihre Einheit im Papier?

β

$\beta$

Y

$Y$

X

$X$

gui11aume

Ich bin mir nicht sicher, ob ich Ihre Frage verstehe. Hier ist eine Beispielzeile einer unabhängigen Variablen nach der Regressionsanalyse aus dem Papier. Transitversorgungsmerkmale: Anzahl der Buslinien (Buslinien) | 0,275 (Beta) | 5,70 *** (t-Wert)

Der Koeffizient selbst ist nicht wie erwähnt gui11aume standardisiert. Die t-Statistik ist jedoch der geschätzte Koeffizient geteilt durch die geschätzte Standardabweichung. Mit t und den Freiheitsgraden könnten Sie den p-Wert und die geschätzte Standardabweichung berechnen, da Beta = t-Wert x geschätzte Standardabweichung. Aber ich bin mir nicht sicher, ob Sie danach suchen oder nicht. Die Beta-Schätzung ist nicht standardisiert. Die t-Statistik ist die standardisierte Form der Schwebungsschätzung. Sie haben also bereits den standardisierten Koeffizienten.

Michael R. Chernick

Antworten:

Es hört sich so an, als würde das Papier ein Mehrfachregressionsmodell im Formular verwenden

Y = β_{0} + \sum_{i} β_{i} ξ_{i} + ε

$Y = \beta_0 + \sum_i \beta_i \xi_i + \varepsilon$

wobei die standardisierte Versionen der unabhängigen Variablen sind; nämlich. , $\xi_i$

ξ_{i} = \frac{x_{i} - m_{i}}{s_{i}}

$\xi_i = \frac{x_i - m_i}{s_i}$

withe der Mittelwert (wie im Beispiel 12,56) und die Standardabweichung (wie 9,02 im Beispiel) der Werte der Variablen (im Beispiel 'Buslinien'). ist der Achsenabschnitt (falls vorhanden). Wenn Sie diesen Ausdruck in das angepasste Modell einfügen, dessen "Betas" als (im Beispiel 0,275), und etwas Algebra ausführen, erhalten Sie die Schätzungen $m_i$ $s_i$ $i^\text{th}$ $x_i$ $\beta_0$ $\hat{\beta_i}$

\hat{Y} = \hat{β_{0}} + \sum_{i} \hat{β_{i}} \frac{x_{i} - m_{i}}{s_{i}} = (\hat{β_{0}} - (\sum_{i} \frac{\hat{β_{i} m_{i}}}{s_{i}})) + \sum_{i} (\frac{\hat{β_{i}}}{s_{i}}) x_{i} .

$\hat{Y} = \hat{\beta_0} + \sum_i \hat{\beta_i} \frac{x_i - m_i}{s_i}=\left(\hat{\beta_0}-\left(\sum_i\frac{\hat{\beta_i m_i}}{s_i}\right)\right)+\sum_i\left(\frac{\hat{\beta_i}}{s_i}\right)x_i.$

Dies zeigt, dass die Koeffizienten von im Modell (abgesehen vom konstanten Term) durch Teilen der Betas durch die Standardabweichungen der unabhängigen Variablen erhalten werden und dass der Achsenabschnitt durch Subtrahieren einer geeigneten linearen Kombination der Betas angepasst wird. $x_i$

Dies gibt Ihnen zwei Möglichkeiten, einen neuen Wert aus einem Vektor unabhängiger Werte vorherzusagen : $(x_1, \ldots, x_p)$

Berechnen Sie mit den in der Veröffentlichung angegebenen Mitteln und Standardabweichungen (nicht aus neuen Daten neu berechnet!) und fügen Sie diese in die Regressionsformel ein, wie sie von den Betas oder äquivalent dazu angegeben wird $m_i$ $s_i$ $(\xi_1,\ldots, \xi_p) = ((x_1-m_1)/s_1, \ldots, (x_p-m_p)/s_p)$
Stecker $(x_1, \ldots, x_p)$

$\hat{Y}$ $1/(1 + \exp(-\hat{Y}))$ $\hat{Y}$

whuber
quelle

Perfect, thank you! Got some help from a colleague. One more question though: My new value (Y-hat) is very low. The author uses a logarithmically transformed dependent variable in his regression. Does that mean I should exp(Y-hat) to expand back up to the untransformed unit of measurement.

Also, there is no Y-intercept included in the paper, and testing the exp(Y-hat) method seems to indicate that there should be a value for Y-intercept that represents some of the variance not explained by the model, in order to raise the predicted outcome to a reasonable level.

Then it is not the coefficients that are stadnardized. It is the variables.

Michael R. Chernick

Michael M, yes,

\exp (\hat{y})

$\exp(\hat{y})$ is probably what you want and yes, you need to find out what the intercept is. You might have to fudge it by guessing the intercept and varying it until your model appears to reproduce any graphics and tables in the paper sufficiently accurately.

whuber

If you are looking to do what the title asks, look here: www3.nd.edu/~rwilliam/stats1/x92.pdf if the y is also standarized. Also see stats.stackexchange.com/questions/235057/…

Chris

B = p \times \frac{s y}{s x}

$B = p \times \frac{sy}{sx}$

$x$ is the independent variable
$y$ is the dependent variable
$s$ is the standard deviation
$p$ is the path coefficient
$B$ is the regression coefficient.

Lance
quelle

I am not sure what a path coefficient is. It looks like perhaps B is a regression coefficient which would not be dimensionless. It would be in y units per 1 x unit. However p=B sx/sy where sx is the estimated standard deviation in x divided by the estimated standard deviation in y and p is dimensionless. It represents an estimated correlation between x and y. Lance if this is what you intended please make the changes by editing your post.

Michael R. Chernick