Statistiken und Big Data

17
Randindexberechnung

Ich versuche herauszufinden, wie der Rand-Index eines Cluster-Algorithmus berechnet wird, aber ich bin nicht sicher, wie die wahren und falschen Negative berechnet werden. Im Moment verwende ich das Beispiel aus dem Buch Eine Einführung in die Informationsbeschaffung (Manning, Raghavan &...

17
Wie man einen QQ-Plot von p-Werten interpretiert

Ich mache GWAS-SNP-Assoziationsstudien zu Krankheiten mit einer Software namens plink ( http://pngu.mgh.harvard.edu/~purcell/plink/download.shtml ). Mit den Assoziationsergebnissen erhalte ich p-Werte für alle analysierten SNPs. Nun benutze ich ein QQ-Diagramm dieser p-Werte, um zu zeigen, ob ein...

17
Wurzelfindung für stochastische Funktion

Angenommen, wir haben eine Funktion , die wir nur durch ein Rauschen beobachten können. Wir können direkt berechnen , nur wobei ein zufälliges Rauschen ist. (In der Praxis: Ich berechne mit einer Monte-Carlo-Methode.)f(x)f(x)f(x)f(x)f(x)f(x)f(x)+ηf(x)+ηf(x) + \etaηη\etaf(x)f(x)f(x) Welche Methoden...

17
Entspricht Kernel-PCA mit linearem Kernel Standard-PCA?

Wenn ich in der Kernel-PCA einen linearen Kernel wähle , wird sich das Ergebnis von der normalen linearen PCA unterscheiden ? Unterscheiden sich die Lösungen grundlegend oder gibt es einen genau definierten Zusammenhang?K(x,y)=x⊤yK(x,y)=x⊤yK(\mathbf{x},\mathbf{y}) = \mathbf x^\top \mathbf...

17
Polynomkontraste für die Regression

Ich kann die Verwendung von Polynomkontrasten bei der Regressionsanpassung nicht verstehen. Insbesondere beziehe ich mich auf eine Codierung, die verwendet wird R, um eine Intervallvariable (Ordinalvariable mit gleichmäßig verteilten Pegeln) auszudrücken, die auf dieser Seite beschrieben wird...

17
Analyse der gewichteten Hauptkomponenten

Nach einiger Suche finde ich sehr wenig über die Einbeziehung von Beobachtungsgewichten / Messfehlern in die Hauptkomponentenanalyse. Was ich finde, stützt sich tendenziell auf iterative Ansätze zur Einbeziehung von Gewichtungen (z . B. hier ). Meine Frage ist, warum dieser Ansatz notwendig ist?...