Ich halte einen Vortrag über das Anpassen von Linien. Ich habe eine einfache lineare Funktion, . Ich versuche, verstreute Datenpunkte zu erhalten, die ich in ein Streudiagramm einfügen kann, damit meine Best-Fit-Linie der gleichen Gleichung entspricht.
Ich würde diese Technik gerne in R oder Excel lernen - je nachdem, was einfacher ist.
r
regression
least-squares
excel
Ryan Chase
quelle
quelle
Antworten:
Wähle ein beliebiges(xi) vorausgesetzt, mindestens zwei davon unterscheiden sich. Setze einen Schnittpunkt β0 und eine Steigung β1 und definiere
Diese Passform ist perfekt. Ohne die Anpassung zu ändern, können Siey0 zu y=y0+ε ändern, indem Sie einen beliebigen Fehlervektor ε=(εi) hinzufügen , sofern dieser sowohl zum Vektor x=(xi) als auch zum konstanten Vektor (1,1,…,1) ) orthogonal ist , 1 , … , 1 ) . Eine einfache Möglichkeit , einen solchen Fehler zu erhalten , ist zu holen jeden Vektor e und lassen ε die Residuen auf Regression sein e gegen x . Im folgenden Code wird e als eine Menge unabhängiger zufälliger Normalwerte mit dem Mittelwert 0 und der gemeinsamen Standardabweichung generiert .
Darüber hinaus können Sie sogar die Menge der Streuung vorwählen, indem Sie möglicherweise festlegen, wasR2 sein soll. Lassen Sie τ2=var(yi)=β21var(xi) , skalieren Sie diese Residuen neu, um eine Varianz von zu haben
Diese Methode ist ganz allgemein: alle möglichen Beispiele (für eine gegebene Menge vonxi ) können auf diese Weise erstellt werden.
Beispiele
Anscombes Quartett
Wir können Anscombes Quartett aus vier qualitativ unterschiedlichen bivariaten Datensätzen mit derselben deskriptiven Statistik (durch die zweite Ordnung) leicht reproduzieren .
Der Code ist bemerkenswert einfach und flexibel.
x
(die x-Koordinaten) unde
zu Beginn (die Fehlermuster) .Simulationen
R
(Es wäre nicht schwierig, dies nach Excel zu portieren - aber es ist ein wenig schmerzhaft.)
Durch Ausführen von könnenR2 ist der beabsichtigte Wert. Andere Statistiken, wie der Regressions-p-Wert, können durch Ändern der Werte von angepasst werdenxich .
summary(fit)
Sie überprüfen, ob die geschätzten Koeffizienten genau wie angegeben und das Vielfache sindquelle