Statistiken und Big Data

17
Versucht BIC, ein echtes Modell zu finden?

Diese Frage ist ein Follow-up oder ein Versuch, mögliche Verwirrung in Bezug auf ein Thema zu beseitigen, das ich und viele andere aufgrund des Unterschieds zwischen AIC und BIC als etwas schwierig empfinde. In einer sehr netten Antwort von @ Dave Kellen zu diesem Thema ( /stats//a/767/30589 )...

17
k-NN Rechenkomplexität

Was ist die zeitliche Komplexität des k -NN-Algorithmus mit naivem Suchansatz (kein kd-Baum oder ähnliches)? Mich interessiert die zeitliche Komplexität auch unter Berücksichtigung des Hyperparameters k . Ich habe widersprüchliche Antworten gefunden: O (nd + kn), wobei n die Kardinalität des...

17
Kolmogorov-Smirnov-Test in R verstehen

Ich versuche die Ausgabe der Kolmogorov-Smirnov-Testfunktion zu verstehen (zwei Beispiele, zweiseitig). Hier ist ein einfacher Test. x <- c(1,2,2,3,3,3,3,4,5,6) y <- c(2,3,4,5,5,6,6,6,6,7) z <- c(12,13,14,15,15,16,16,16,16,17) ks.test(x,y) # Two-sample Kolmogorov-Smirnov test # #data: x...

17
Was ist die VC-Dimension eines Entscheidungsbaums?

Was ist die VC-Dimension eines Entscheidungsbaums mit k Teilungen in zwei Dimensionen? Angenommen, das Modell ist CART und die einzigen zulässigen Teilungen verlaufen parallel zu den Achsen. Für eine Teilung können wir also 3 Punkte in einem Dreieck ordnen und dann für jede Beschriftung der Punkte...

17
Wie erstelle ich das endgültige Modell und optimiere den Wahrscheinlichkeitsschwellenwert nach einer verschachtelten Kreuzvalidierung?

Erstens, Entschuldigung für das Posten einer Frage, die hier , hier , hier , hier , hier bereits ausführlich besprochen wurde, und zum Aufwärmen eines alten Themas. Ich weiß, dass @DikranMarsupial ausführlich über dieses Thema in Beiträgen und Fachzeitschriften geschrieben hat, aber ich bin immer...