Statistiken und Big Data

18
Gehen Statistiker davon aus, dass man eine Pflanze nicht übergießen kann, oder verwende ich nur die falschen Suchbegriffe für die krummlinige Regression?

Fast alles, was ich über lineare Regression und GLM lese , läuft darauf hinaus: y=f(x,β)y=f(x,β)y = f(x,\beta) wobei f(x,β)f(x,β)f(x,\beta) eine nicht zunehmende oder nicht abnehmende Funktion von xxx und ββ\beta der Parameter ist, den Sie schätzen und testen Hypothesen über. Es gibt Dutzende von...

18
Paarweise Mahalanobis-Entfernungen

Ich muss den Mahalanobis-Abstand in R zwischen jedem Beobachtungspaar in einer n×pn×pn \times p Matrix von Kovariaten berechnen. Ich benötige eine effiziente Lösung, dh es werden nur Abstände berechnet und vorzugsweise in C / RCpp / Fortran usw. implementiert. Ich gehe davon aus, dass , die...

18
Was sind die vier Achsen im PCA-Biplot?

Wenn Sie einen Biplot für eine PCA-Analyse erstellen, haben Sie die Hauptkomponente PC1-Scores auf der x-Achse und PC2-Scores auf der y-Achse. Aber was sind die anderen beiden Achsen rechts und oben auf dem

18
T-Test auf stark verzerrten Daten

Ich habe einen Datensatz mit zehntausenden Beobachtungen von medizinischen Kostendaten. Diese Daten sind stark nach rechts verschoben und enthalten viele Nullen. Es sieht für zwei Personengruppen so aus (in diesem Fall zwei Altersgruppen mit jeweils> 3000 Beobachtungen): Min. 1st Qu. Median...

18
MCMC in einem begrenzten Parameterraum?

Ich versuche, MCMC auf ein Problem anzuwenden, aber meine Prioritäten (in meinem Fall ) sind auf einen Bereich beschränkt? Kann ich normales MCMC verwenden und die Samples ignorieren, die außerhalb der eingeschränkten Zone liegen (in meinem Fall [0,1] ^ 2), dh die Übergangsfunktion wiederverwenden,...

18
Wie hängt MANOVA mit LDA zusammen?

An mehreren Stellen sah ich die Behauptung, dass MANOVA wie ANOVA plus lineare Diskriminanzanalyse (LDA) ist, aber es wurde immer auf eine Art von Handbewegung gemacht. Ich würde gerne wissen, was es genau bedeuten soll. Ich habe verschiedene Lehrbücher gefunden, die alle Details von...

18
Was genau heißt in PCA „Hauptkomponente“?

Angenommen, ist der Vektor, der die Varianz der Projektion der Daten mit der Entwurfsmatrix maximiert .XuuuXXX Nun habe ich Materialien gesehen, die als (ersten) Hauptbestandteil der Daten bezeichnen, der auch der Eigenvektor mit dem größten Eigenwert ist.uuu Ich habe jedoch auch gesehen, dass...