Ich habe Daten, bei denen das Ergebnis der Anteil einer Art ist, der in einem Gebiet von einer Maschine an zwei verschiedenen Tagen beobachtet wurde. Da das Ergebnis ein Anteil ist und nicht 0 oder 1 enthält, habe ich eine Beta-Regression verwendet, um das Modell anzupassen. Die Temperatur wird als unabhängige Variable verwendet. Hier ist ein Spielzeug-R-Code:
set.seed(1234)
library(betareg)
d <- data.frame(
DAY = c(1,1,1,1,2,2,2,2),
Proportion = c(.4,.1,.25, .25, .5,.3,.1,.1),
MACHINE = c("A","B","C","D","H","G","K","L"),
TEMPERATURE = c(rnorm(8)*100)
)
b <- betareg(Proportion ~ TEMPERATURE,
data= d, link = "logit", link.phi = NULL, type = "ML")
summary(b)
## Call:
## betareg(formula = Proportion ~ TEMPERATURE, data = d, link = "logit", link.phi = NULL, type = "ML")
##
## Standardized weighted residuals 2:
## Min 1Q Median 3Q Max
## -1.2803 -1.2012 0.3034 0.6819 1.6494
##
## Coefficients (mean model with logit link):
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.0881982 0.2620518 -4.153 3.29e-05 ***
## TEMPERATURE 0.0003469 0.0023677 0.147 0.884
##
## Phi coefficients (precision model with identity link):
## Estimate Std. Error z value Pr(>|z|)
## (phi) 9.305 4.505 2.066 0.0389 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Oben sehen Sie, dass der TEMPERATURE
Koeffizient .0003469 ist. Exponentiating, exp (.0003469) = 1.000347
Update mit Antworten und Kommentaren:
Sie können hier sehen, wie eine Erhöhung der Temperatur um 1 Einheit von -10 auf 10 den Anteil erhöht
nd <- data.frame(TEMPERATURE = seq(-10, 10, by = 1))
nd$Proportion <- predict(b, newdata = nd)
nd$proportion_ratio <- nd$Proportion/(1 - nd$Proportion)
plot(Proportion ~ TEMPERATURE, data = nd, type = "b")
Die Interpretation lautet: Eine Änderung um 1 Einheit TEMPERATURE
führt zu einer relativen Änderung von 1.000347 ≈0,04% in Proportion
:
Das Schlüsselwort dort ist eine relative Änderung. Wenn Sie also mit vergleichen exp(coef(b))[2]
, werden nd$proportion_ratio[2] / nd$proportion_ratio[1]
Sie feststellen, dass sie gleich sind
## ratio of proportion
nd$proportion_ratio[2] / nd$proportion_ratio[1]
exp(coef(b))[2]
nd$proportion_ratio[-1] / nd$proportion_ratio[-20]
quelle
Proportion
ist, wie der Name es vermuten lässt, dann ist es diskret, nicht kontinuierlich und eine logistische Regression wäre wahrscheinlich besser geeignet, um es zu modellieren.Antworten:
Ja, der Logit-Link kann so interpretiert werden. Es ist einfach keine Änderung der "Gewinnchancen" (= Verhältnis der Wahrscheinlichkeiten), sondern eine Änderung des Verhältnisses der Proportionen. Formal ist die Modellgleichung für die Erwartung dieselbe wie bei der logistischen Regression: wobei . Für Ihr Setup bedeutet dies: Somit führt eine absolute Änderung von 1 Einheit zu einer relativen Änderung von
Mit ein wenig Übung können Sie ein vernünftiges Gefühl dafür bekommen, was dies im tatsächlich erwarteten . Wenn Sie dieses Gefühl (noch) nicht haben, können Sie die Auswirkungen der Änderungen in leicht berechnen , z.P r o p o r t i o n T e mp e r a t u r e
um zu überprüfen, was die absoluten Änderungen in
Proportion
für bestimmte absolute Änderungen in sindTEMPERATURE
.quelle
predict
Methode kann Ihnen den erwarteten oder nur den linearen Prädiktor ( ), den Parameter , die Varianz, Quantile usw. geben"response"
"link"
"precision"
GasolineYield
Datenyield = 0.5
, dass der Anteil von 50% Rohöl in Benzin umgewandelt wird. Dies entspricht einem Verhältnis von 1 = 0,5 / 0,5, dh es wird so viel Rohöl umgewandelt wie nicht umgewandelt. Wenn dies um 10% zunimmt, beträgt das neue Verhältnis 1,1, was einem Anteil von etwa 0,5238 entspricht. Somit sind die Rechenschritte im Wesentlichen die gleichen wie im Logit-Modell. Re: Erklärung für Laien. Ich habe die Erfahrung gemacht, dass auch Quotenverhältnisse sehr schwer zu verstehen sind ... daher verwende ich häufig Effektdiagramme.