Weiß jemand, wie man herausfindet, ob die Punkte 7, 16 und 29 Einflusspunkte sind oder nicht? Ich habe irgendwo gelesen, dass Cooks Entfernung kleiner als 1 ist, sie aber nicht. Habe ich recht?
r
regression
residuals
diagnostic
cooks-distance
Platypezid
quelle
quelle
Antworten:
John Fox (1) ist in seiner Broschüre zur Regressionsdiagnostik bei der Angabe numerischer Schwellenwerte eher vorsichtig. Er rät zur Verwendung von Grafiken und zur näheren Untersuchung der Punkte mit "Werten von D, die wesentlich größer sind als die übrigen". Laut Fox sollten Schwellenwerte nur zur Verbesserung der grafischen Darstellung verwendet werden.
In Ihrem Fall könnten die Beobachtungen 7 und 16 als einflussreich angesehen werden. Naja, ich würde sie mir wenigstens genauer ansehen. Die Beobachtung 29 unterscheidet sich nicht wesentlich von einigen anderen Beobachtungen.
(1) Fox, John. (1991). Regressionsdiagnose: Eine Einführung . Salbei Veröffentlichungen.
quelle
Es gibt noch einen weiteren Punkt, den Sie hier ansprechen sollten. In der Beobachtungsforschung ist es oft schwierig, eine einheitliche Stichprobe über den Prädiktorraum zu erstellen, und Sie haben möglicherweise nur wenige Punkte in einem bestimmten Bereich. Solche Punkte können vom Rest abweichen. Einige wenige Fälle zu haben, kann unangenehm sein, aber es lohnt sich, darüber nachzudenken, bevor man als Ausreißer absteigt. Es kann zu Recht eine Interaktion zwischen den Prädiktoren geben, oder das System kann sich anders verhalten, wenn die Prädiktorwerte extrem werden. Darüber hinaus können sie Ihnen möglicherweise dabei helfen, die Auswirkungen von kolinearen Prädiktoren zu entwirren. Einflusspunkte könnten ein Segen in der Verkleidung sein.
quelle