Statistiken und Big Data

15
Was bedeutet es, die Varianz zu erklären?

Insbesondere frage ich mich, warum wir dieses Konzept Multiple R (das ich als die Korrelation zwischen beobachteten und vorhergesagten Ergebnissen in multipler Regression verstehen kann) und dann ein separates Konzept R-Quadrat haben, das nur das Quadrat oder R ist. Ich wurde informiert, dass...

15
SVM für unausgeglichene Daten

Ich möchte versuchen, Support Vector Machines (SVMs) für mein Dataset zu verwenden. Bevor ich das Problem versuchte, wurde ich gewarnt, dass SVMs bei extrem unausgeglichenen Daten keine gute Leistung bringen. In meinem Fall kann ich bis zu 95-98% 0 und 2-5% 1 haben. Ich habe versucht, Ressourcen zu...

15
Gratregression - Bayesianische Interpretation

Ich habe gehört, dass die Gratregression als Mittelwert einer posterioren Verteilung abgeleitet werden kann, wenn der Prior angemessen gewählt wird. Ist die Intuition, dass die Einschränkungen, die für die Regressionskoeffizienten durch den Prior festgelegt wurden (z. B. Standardnormalverteilungen...

15
Wie berechne ich die Reinheit?

Wie berechnen wir in der Clusteranalyse die Reinheit? Wie lautet die Gleichung? Ich suche keinen Code, um das für mich zu tun. Sei ωkωk\omega_k der Cluster k und cjcjc_j die Klasse j. Ist Reinheit also praktisch genau? Es sieht so aus, als würde die Menge der wirklich klassifizierten Klassen pro...

15
Thesaurus für Statistik und Maschinelles Lernen

Gibt es einen Referenzthesaurus für Statistiken und Begriffe des maschinellen Lernens? Ich weiß, dass Wikipedia-Artikel häufig Synonyme enthalten, aber ich hätte gerne einen bloßen Thesaurus, den ich einfach durchgehen könnte (im Gegensatz zu einer vollständigen Enzyklopädie), um sicherzustellen,...

15
Bedeutung latenter Merkmale?

Ich versuche, Matrixfaktorisierungsmodelle für Empfehlungssysteme zu verstehen und lese immer "latente Merkmale", aber was bedeutet das? Ich weiß, was eine Funktion für einen Trainingsdatensatz bedeutet, kann aber die Idee latenter Funktionen nicht verstehen. Jedes Papier zu dem Thema, das ich...

15
P-Werte im Permutationstest gleich 0

Ich habe zwei Datensätze und möchte wissen, ob sie sich erheblich unterscheiden oder nicht (dies kommt von " Zwei Gruppen unterscheiden sich erheblich? Test zu verwenden "). Ich habe mich für einen Permutationstest entschieden und in R Folgendes durchgeführt: permutation.test <- function(coding,...