Könnte jemand einige Hinweise zur Verwendung des weights
Arguments in der lm
Funktion von R geben ? Angenommen, Sie haben versucht, ein Modell für Verkehrsdaten zu erstellen, und Sie hatten mehrere hundert Zeilen, von denen jede eine Stadt (mit einer anderen Bevölkerung) darstellt. Wenn Sie möchten, dass das Modell den relativen Einfluss jeder Beobachtung basierend auf der Populationsgröße anpasst, können Sie dies einfach angeben weights=[the column containing the city's population]
? Ist das die Art von Vektor, in die man hineingehen kann weights
? Oder müssten Sie eine andere R-Funktion / ein anderes Paket / einen anderen Ansatz verwenden?
Neugierig zu hören, wie die Leute dieses Problem angehen - ich habe es in keinem der Tutorials zur linearen Modellierung gesehen, die ich dort gesehen habe. Vielen Dank!
quelle
lm
Zusammenfassung, wenn sie gegen nicht skaliert sind ...lm
Zusammenfassung anders ? Die Koeffizienten oder die Standardfehler?Was Sie vorschlagen, sollte funktionieren. Sehen Sie, ob dies sinnvoll ist:
Die zweite Linie erzeugt den gleichen Schnitt und die gleiche Steigung wie die dritte Linie (im Unterschied zum Ergebnis der ersten Linie), indem eine Beobachtung relativ doppelt so schwer ist wie jede der beiden anderen Beobachtungen, ähnlich wie das Duplizieren der dritten Beobachtung.
quelle
summary
Ausgabe für die 2. und 3. Zeile unterschiedlich ist, insbesondere für den p-Wert des Koeffizienten. Ich frage mich, dass dies passieren wird, wenn sich die beiden Anweisungen auf denselben Datensatz beziehen. Ich habe eine Frage dazu auf stackoverflow.com/questions/10268689/weighted-regression-in-r