Statistiken und Big Data

20
Warum funktioniert Feature Engineering?

Kürzlich habe ich erfahren, dass eine Möglichkeit, bessere Lösungen für ML-Probleme zu finden, in der Erstellung von Features besteht. Man kann das zum Beispiel durch Summieren von zwei Merkmalen tun. Zum Beispiel besitzen wir zwei Funktionen "Angriff" und "Verteidigung" einer Art Held. Wir...

20
lme () und lmer () liefern widersprüchliche Ergebnisse

Ich habe mit Daten gearbeitet, die Probleme mit wiederholten Messungen haben. Dabei habe ich ein sehr unterschiedliches Verhalten zwischen lme()und unter lmer()Verwendung meiner Testdaten festgestellt und möchte wissen warum. Der von mir erstellte gefälschte Datensatz enthält Größen- und...

20
Überanpassung und Unteranpassung

Ich habe einige Nachforschungen über Über- und Unteranpassung angestellt und ich habe verstanden, was sie genau sind, aber ich kann die Gründe nicht finden. Was sind die Hauptgründe für Über- und Unterausstattung? Warum treten diese beiden Probleme beim Trainieren eines Modells...

19
Lernressourcen zum Erstellen von Datenvisualisierungen?

Ich bin daran interessiert zu lernen, wie Sie die Art von Visualisierungen erstellen, die Sie unter http://flowingdata.com und informationisbeautiful sehen. EDIT: Das heißt, Visualisierungen, die für sich selbst interessant sind - ein bisschen wie die NY Times-Grafiken, im Gegensatz zu einem...

19
Messungen der Modellkomplexität

Wie können wir die Komplexität zweier Modelle mit der gleichen Anzahl von Parametern vergleichen? Edit 09/19 : Um zu verdeutlichen, ist die Modellkomplexität ein Maß dafür, wie schwierig es ist, aus begrenzten Daten zu lernen. Wenn zwei Modelle zu vorhandenen Daten gleich gut passen, führt ein...