Als «r» getaggte Fragen

71

Entfernen doppelter Zeilendatenrahmen in R [geschlossen]

Wie kann ich doppelte Zeilen aus diesem Beispieldatenrahmen entfernen? A 1 A 1 A 2 B 4 B 1 B 1 C 2 C 2 Ich möchte die Duplikate entfernen, die auf beiden Spalten basieren: A 1 A 2 B 4 B 1 C 2 Ordnung ist nicht

r

71

Generieren Sie eine Zufallsvariable mit einer definierten Korrelation zu einer oder mehreren vorhandenen Variablen.

Für eine Simulationsstudie muss ich Zufallsvariablen generieren, die eine vorab festgelegte (Populations-) Korrelation zu einer vorhandenen Variablen .Y.YY Ich sah in die RPakete copulaund CDVineder Zufall multivariate Verteilungen mit einer bestimmten Abhängigkeitsstruktur erzeugen kann. Es ist...

r correlation random-variable random-generation independence assumptions random-variable unbiased-estimator regression hypothesis-testing heteroscedasticity generalized-least-squares distributions networks data-visualization sas reproducible-research philosophical time-series variance outliers quality-control mean multilevel-analysis average weighted-mean regression confidence-interval prediction-interval correlation matlab matrix data-mining maximum-likelihood r time-series survival predictive-models

70

Was ist der Unterschied zwischen den R-Funktionen prcomp und princomp?

Ich habe etwas über Q-Mode- und R-Mode-Hauptkomponentenanalyse (PCA) verglichen ?prcompund ?princompgefunden. Aber ehrlich - ich verstehe es nicht. Kann jemand den Unterschied erklären und vielleicht sogar erklären, wann welche Anwendung anzuwenden

r pca

69

Form des Konfidenzintervalls für vorhergesagte Werte in der linearen Regression

Ich habe festgestellt, dass das Konfidenzintervall für vorhergesagte Werte in einer linearen Regression um den Mittelwert des Prädiktors und Fett um den minimalen und den maximalen Wert des Prädiktors eng ist. Dies ist in den Diagrammen dieser 4 linearen Regressionen zu sehen: Anfangs dachte ich,...

regression confidence-interval linear-model standard-error prediction-interval

68

Multivariate multiple Regression in R

Ich habe 2 abhängige Variablen (DVs), deren Punktzahl durch die Menge von 7 unabhängigen Variablen (IVs) beeinflusst werden kann. DVs sind kontinuierlich, während der Satz von IVs aus einer Mischung aus kontinuierlichen und binär codierten Variablen besteht. (Im folgenden Code werden fortlaufende...

r multivariate-analysis manova multiple-regression multivariate-regression

67

Wie genau stimmten Statistiker darin überein, (n-1) als unverzerrten Schätzer für die Populationsvarianz ohne Simulation zu verwenden?

Die Formel zur Berechnung der Varianz hat im Nenner :(n−1)(n−1)(n-1) s2=∑Ni=1(xi−x¯)2n−1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} Ich habe mich immer gefragt, warum. Das Lesen und Anschauen einiger guter Videos über das "Warum" von scheint jedoch ein guter unverzerrter...

variance unbiased-estimator proof history

66

Welche Korrelation macht eine Matrix singulär und was sind Implikationen von Singularität oder Fast-Singularität?

Ich mache einige Berechnungen mit verschiedenen Matrizen (hauptsächlich in der logistischen Regression) und bekomme häufig den Fehler "Matrix ist singulär", wo ich zurückgehen und die korrelierten Variablen entfernen muss. Meine Frage hier ist, was würden Sie als "hoch" korrelierte Matrix...

regression correlation matrix multicollinearity singular

66

Berechnung der Parameter einer Beta-Verteilung anhand des Mittelwerts und der Varianz

Wie kann ich die Parameter und für eine Beta-Verteilung berechnen, wenn ich den Mittelwert und die Varianz kenne, die die Verteilung haben soll? Beispiele für einen R-Befehl dazu wären am

r distributions estimation beta-distribution

64

Wie kann das Hinzufügen einer 2. IV die 1. IV signifikant machen?

Ich habe wahrscheinlich eine einfache Frage, aber sie verblüfft mich gerade. Ich hoffe, dass Sie mir helfen können. Ich habe ein Regressionsmodell der kleinsten Quadrate mit einer unabhängigen und einer abhängigen Variablen. Die Beziehung ist nicht signifikant. Jetzt füge ich eine zweite...

regression multiple-regression power suppressor

64

Wie interpretiere ich Koeffizienten in einer Poisson-Regression?

Wie kann ich die Haupteffekte (Koeffizienten für Dummy-codierten Faktor) in einer Poisson-Regression interpretieren? Nehmen wir das folgende Beispiel an: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2,...

r generalized-linear-model interpretation poisson-distribution regression-coefficients

64

Ist die R-Sprache für das Gebiet der Ökonomie zuverlässig?

Ich bin ein Doktorand der Wirtschaftswissenschaften, der kürzlich von anderen sehr bekannten statistischen Paketen auf R umgestellt hat (ich habe hauptsächlich SPSS verwendet). Mein kleines Problem im Moment ist, dass ich der einzige R-User in meiner Klasse bin. Meine Klassenkameraden benutzen...

r software econometrics

63

Befindet sich nach der PCA noch eine Rotation (z. B. Varimax)?

Ich habe versucht, einige Forschungen (mit PCA) von SPSS in R zu reproduzieren. Nach meiner Erfahrung war die principal() Funktion aus Paket psychdie einzige Funktion, die der Ausgabe entsprach (oder wenn mein Gedächtnis richtig funktioniert). Um die gleichen Ergebnisse wie in SPSS zu erzielen,...

r spss pca factor-analysis factor-rotation

62

Wie sollen winzige

Für einige Tests in Rgibt es eine Untergrenze für die p-Wert- Berechnungen von . Ich bin mir nicht sicher, warum es diese Nummer ist, ob es einen guten Grund dafür gibt oder ob es nur willkürlich ist. Viele andere Statistikpakete werden nur verwendet , daher ist dies ein viel höheres Maß an...

r p-value reporting precision

62

Wie kann man einen Beispielbaum aus randomForest :: getTree () zeichnen? [geschlossen]

Jeder hat Bibliotheks- oder Codevorschläge, wie man tatsächlich ein paar Beispielbäume plottet : getTree(rfobj, k, labelVar=TRUE) (Ja, ich weiß, Sie sollten dies nicht operativ tun, RF ist eine Blackbox usw. usw. Ich möchte einen Baum visuell auf Fehler überprüfen, um festzustellen, ob sich...

r data-visualization random-forest cart

62

Was bedeuten die Residuen in einer logistischen Regression?

Bei der Beantwortung dieser Frage schlug John Christie vor, die Anpassung logistischer Regressionsmodelle durch Auswertung der Residuen zu bewerten. Ich kenne mich mit der Interpretation von Residuen in OLS aus. Sie sind im selben Maßstab wie die DV und sehr deutlich der Unterschied zwischen y und...

r logistic generalized-linear-model residuals aic

61

Warum ist der Jeffreys Prior nützlich?

Ich verstehe, dass der Jeffreys-Prior unter Umparametrierung unveränderlich ist. Was ich jedoch nicht verstehe, ist, warum diese Eigenschaft gewünscht wird. Warum möchten Sie nicht, dass sich das Vorher bei einem Variablenwechsel

bayesian prior

60

Warum erhöht das Sammeln von Daten bis zum Erreichen eines signifikanten Ergebnisses die Fehlerrate von Typ I?

Ich habe mich genau gefragt, warum das Sammeln von Daten bis zu einem signifikanten Ergebnis (z. B. ) die Typ-I-Fehlerrate erhöht.p<.05p<.05p \lt .05 Ich würde mich auch sehr über eine RDemonstration dieses Phänomens

r hypothesis-testing p-value simulation type-i-and-ii-errors

60

Erkläre den xkcd-Gummibärchen-Comic: Was macht es lustig?

Ich sehe, dass einmal von den insgesamt zwanzig Tests, die sie durchführen, , so dass sie fälschlicherweise annehmen, dass während eines der zwanzig Tests das Ergebnis signifikant ist ( ).0,05 = 1 / 20p < 0,05p<0.05p < 0.050,05 = 1 / 200.05=1/200.05 = 1/20 xkcd Gummibärchen-Comic -...

hypothesis-testing statistical-significance confidence-interval p-value humor

60

Warum wird die räumliche Autokorrelation durch die Aufnahme von Breiten- und Längengraden in ein GAM berücksichtigt?

Ich habe verallgemeinerte additive Modelle für die Entwaldung erstellt. Um die räumliche Autokorrelation zu berücksichtigen, habe ich Breitengrad und Längengrad als geglätteten Interaktionsterm (dh s (x, y)) eingeschlossen. Ich habe dies auf das Lesen vieler Artikel gestützt, in denen die Autoren...

r modeling spatial autocorrelation gam

60

Standardfehler für die Lasso-Vorhersage mit R

Ich versuche, ein LASSO-Modell für die Vorhersage zu verwenden, und ich muss Standardfehler abschätzen. Sicher hat schon jemand ein Paket dazu geschrieben. Aber meines Erachtens gibt keines der CRAN-Pakete, die mit einem LASSO Vorhersagen treffen, Standardfehler für diese Vorhersagen zurück. Meine...

r standard-error prediction lasso