Statistiken und Big Data

9
Wie führe ich mehrere Post-hoc-Chi-Quadrat-Tests an einem 2 x 3-Tisch durch?

Mein Datensatz umfasst entweder die Gesamtmortalität oder das Überleben eines Organismus an drei Standorttypen: Inshore, Midchannel und Offshore. Die Zahlen in der folgenden Tabelle geben die Anzahl der Standorte an. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1...

9
Platzsparendes Clustering

Die meisten Clustering-Algorithmen, die ich gesehen habe, beginnen mit der Erstellung von Abständen zwischen allen Punkten, was bei größeren Datensätzen problematisch wird. Gibt es einen, der das nicht tut? Oder ist es eine Art partieller / ungefährer / gestaffelter Ansatz? Welcher...

9
Radfahren im k-means-Algorithmus

Laut Wiki ist das am häufigsten verwendete Konvergenzkriterium "Zuordnung hat sich nicht geändert". Ich habe mich gefragt, ob Radfahren auftreten kann, wenn wir ein solches Konvergenzkriterium verwenden. Ich würde mich freuen, wenn jemand auf einen Artikel verweist, der ein Beispiel für das...

9
Kategorisierungs- / Segmentierungstechniken

Lassen Sie mich zunächst sagen, dass ich hier etwas überfordert bin. Wenn diese Frage also neu formuliert oder als Duplikat geschlossen werden muss, lassen Sie es mich bitte wissen. Es kann einfach sein, dass ich nicht das richtige Vokabular habe, um meine Frage auszudrücken. Ich arbeite an einer...