Kann mir jemand das Konzept der Mahalanobis-Distanz erklären? Wie groß ist beispielsweise der Mahalanobis-Abstand zwischen zwei Punkten x und y und wie wird er insbesondere für die Mustererkennung
Kann mir jemand das Konzept der Mahalanobis-Distanz erklären? Wie groß ist beispielsweise der Mahalanobis-Abstand zwischen zwei Punkten x und y und wie wird er insbesondere für die Mustererkennung
Ein Beispiel für ein gutes Maß für die Klassentrennbarkeit bei Lernenden mit linearer Diskriminanz ist das lineare Diskriminanzverhältnis von Fisher. Gibt es andere nützliche Metriken, um festzustellen, ob Feature-Sets eine gute Klassentrennung zwischen Zielvariablen bieten? Insbesondere bin ich...
Ich habe es wahrscheinlich mit einem Problem zu tun, das wahrscheinlich schon hundert Mal gelöst wurde, aber ich bin mir nicht sicher, wo ich die Antwort finden kann. Bei Verwendung der logistischen Regression werden bei vielen Funktionen und versuchen , einen binären kategorischen Wert...
Ich trainiere einen Gaußschen Prozess mit einem ARD-Kernel mit vielen Parametern, indem ich die marginale Lielihood der Daten maximiere, anstatt sie gegenseitig zu validieren. Ich vermute, dass es überpassend ist. Wie kann ich diesen Verdacht in einem Bayes'schen Kontext
Ich lese dieses Papier über generalisierte Wishart-Prozesse (GWP) durch. Die Arbeit berechnet die Kovarianzen zwischen verschiedenen Zufallsvariablen (nach dem Gaußschen Prozess ) unter Verwendung der quadratischen exponentiellen Kovarianzfunktion, dh . Es heißt dann, dass diese Kovarianzmatrix GWP...
Mir wurde kürzlich gesagt, dass der Prozess, dem ich folgte (Bestandteil einer MS-Arbeit), als überpassend angesehen werden könnte. Ich versuche, dies besser zu verstehen und zu sehen, ob andere zustimmen. Das Ziel dieses Teils des Papiers ist es, Vergleichen Sie die Leistung von...
Ich habe ein Problem mit der binären Klassifizierung und experimentiere mit verschiedenen Klassifizierern: Ich möchte die Klassifizierer vergleichen. Welches ist ein besseres Maß für die AUC oder Genauigkeit? Und warum? Raondom Forest: AUC: 0.828 Accuracy: 79.6667 % SVM: AUC: 0.542 Accuracy:...
Kann jemand helfen, eine konzeptionelle Erklärung dafür zu geben, wie Vorhersagen für neue Daten getroffen werden, wenn Glättungen / Splines für ein Vorhersagemodell verwendet werden? Wie werden beispielsweise bei einem Modell, das mit gamboostdem mboostPaket in R mit p-Splines erstellt wurde,...
Ich bin mir nicht sicher, ob dies für diese Site geeignet ist, aber ich beginne mein MSE in Informatik (BS in angewandter Mathematik) und möchte einen starken Hintergrund im maschinellen Lernen haben (ich werde höchstwahrscheinlich promovieren). Eines meiner Unterinteressen sind neuronale Netze....
Die mir bekannte Methode zum Erstellen einer zufälligen Gesamtstruktur lautet wie folgt: (von http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm ) Um einen Baum im Wald zu bauen, haben wir: Booten Sie eine Stichprobe der Größe N, wobei N die Größe unseres Trainingssatzes ist....
Gibt es eine Strategie zur Auswahl der Anzahl der Bäume in einem GBM? Insbesondere das ntreesArgument in Rder gbmFunktion. Ich verstehe nicht, warum Sie nicht ntreesden höchsten vernünftigen Wert einstellen sollten . Ich habe festgestellt, dass eine größere Anzahl von Bäumen die Variabilität der...
Ich versuche, die Entscheidungsgrenze eines Perzeptron-Algorithmus zu zeichnen, und bin über einige Dinge wirklich verwirrt. Meine Eingabeinstanzen haben die Form , im Grunde eine 2D-Eingabeinstanz ( x 1 und x 2 ) und einen Binärklassenzielwert ( y ) [1 oder 0].[ ( x1, x2) ,
Ich arbeite derzeit an einer Gesichtserkennungssoftware, die Faltungs-Neuronale Netze verwendet, um Gesichter zu erkennen. Aufgrund meiner Messwerte habe ich festgestellt, dass ein neuronales Faltungsnetzwerk gemeinsame Gewichte hat, um Zeit während des Trainings zu sparen. Aber wie passt man die...
Ich habe PCA mit 17 quantitativen Variablen ausgeführt, um einen kleineren Satz von Variablen zu erhalten, dh Hauptkomponenten, die beim überwachten maschinellen Lernen zur Klassifizierung von Instanzen in zwei Klassen verwendet werden sollen. Nach PCA macht PC1 31% der Varianz in den Daten aus,...
Ich wollte den genauen Test des Fischers besser verstehen, deshalb habe ich das folgende Spielzeugbeispiel entwickelt, bei dem f und m männlich und weiblich und n und y dem "Sodakonsum" wie folgt entsprechen: > soda_gender f m n 0 5 y 5 0 Dies ist natürlich eine drastische Vereinfachung,...
Ich fand ein sehr hilfreiches Tutorial zum EM-Algorithmus . Das Beispiel und das Bild aus dem Tutorial sind einfach genial. Verwandte Frage zur Berechnung von Wahrscheinlichkeiten Wie funktioniert die Erwartungsmaximierung? Ich habe noch eine Frage, wie man die im Tutorial beschriebene Theorie mit...
Ich mache ML an meiner Universität, und der Professor erwähnte den Begriff Erwartung (E), während er versuchte, uns einige Dinge über Gaußsche Prozesse zu erklären. Aber von der Art, wie er es erklärte, verstand ich, dass E dasselbe ist wie der Mittelwert μ. Habe ich richtig verstanden? Wenn es...
Ich versuche, einen Dirichlet-Prozess zu implementieren und zu lernen, um meine Daten zu gruppieren (oder während die Leute beim maschinellen Lernen sprechen, schätzen Sie die Dichte). Ich habe viel Papier zu diesem Thema gelesen und bin irgendwie auf die Idee gekommen. Aber ich bin immer noch...
Ich bin ein Neuling im Bereich maschinelles Lernen (auch einige Statistiken), habe eine Weile Wissen gelernt (überwachte / unbeaufsichtigte Lernalgorithmen, relevante Optimierungsmethoden, Regularisierungen, einige Philosophien (wie Bias-Varianz-Kompromiss?)). Ich weiß, dass ich ohne echte Übung...
Ich habe in letzter Zeit versucht, mehr über Online-Lernen zu lernen (es ist absolut faszinierend!), Und ein Thema, das ich nicht richtig verstehen konnte, ist, wie man über Modellauswahl in Offline- oder Online-Kontexten nachdenkt. Insbesondere nehmen wir trainieren ein Klassifikator offline,...