Statistiken und Big Data

20
Warum wird für zufällige Waldbäume kein Schnitt benötigt?

Breiman sagt, dass die Bäume ohne Beschneiden gewachsen sind. Warum? Ich will damit sagen, dass es einen soliden Grund geben muss, warum die Bäume in zufälligen Wäldern nicht beschnitten werden. Andererseits wird es als sehr wichtig angesehen, einen einzelnen Entscheidungsbaum zu beschneiden, um...

20
Gepaart gegen ungepaarten T-Test

Angenommen, ich habe 20 Mäuse. Ich paare die Mäuse auf irgendeine Weise, so dass ich 10 Paare bekomme. Für den Zweck dieser Frage könnte es sich um eine zufällige Paarung handeln, ODER es könnte sich um eine sinnvolle Paarung handeln, beispielsweise um den Versuch, Mäuse aus demselben Wurf mit...

20
Test auf lineare Trennbarkeit

Gibt es eine Möglichkeit, die lineare Separierbarkeit eines Datasets mit zwei Klassen in hohen Dimensionen zu testen? Meine Merkmalsvektoren sind 40 lang. Ich weiß, dass ich jederzeit logistische Regressionsexperimente durchführen und die Hitrate im Vergleich zur Falschalarmrate bestimmen kann, um...

20
EM-Algorithmus manuell implementiert

Ich möchte den EM-Algorithmus manuell implementieren und ihn dann mit den Ergebnissen des normalmixEMof- mixtoolsPakets vergleichen. Natürlich würde ich mich freuen, wenn beide zu den gleichen Ergebnissen führen würden. Die Hauptreferenz ist Geoffrey McLachlan (2000), Finite Mixture Models . Ich...