Ich bin auf ein Gerücht gestoßen, dass einige Studien gezeigt haben, dass die Leistung von Vorhersagemodellen mehr von der Expertise des Datenanalysten mit der gewählten Methode abhängt als von der Wahl der Methode.
Mit anderen Worten, die Behauptung ist, dass es wichtiger ist, dass der Datenanalyst mit der gewählten Methode vertraut ist, als wie "angemessen" die Methode für das Problem vom theoretischeren Standpunkt aus erscheint.
Dies wurde im Zusammenhang mit der Chemometrie erwähnt, die typischerweise Probleme mit vielen Variationen (100s - 1000s), multipler Kollinearität und natürlich zu wenig Proben beinhaltet. Die Vorhersage kann eine Klassifizierung oder eine Regression gewesen sein.
Meine persönliche Erfahrung legt nahe, dass dies plausibel ist , aber eine Studie wurde erwähnt (ich habe die Person, die dies erwähnt hat, nach einer schnellen, aber erfolglosen Suche per E-Mail gefragt, aber keine Antwort erhalten). Allerdings konnte ich auch bei einer aufwändigeren Suche keine Papiere finden.
Kennt jemand solche Erkenntnisse? Wenn nicht, was sagt die persönliche Erfahrung von Big Guys hier aus?
quelle
Antworten:
Tatsächlich habe ich ein Gerücht gehört, dass anständige Lernmaschinen normalerweise besser sind als Experten, da die menschliche Neigung darin besteht, die Varianz auf Kosten der Verzerrung (Überglättung) zu minimieren, was zu einer schlechten Prognoseleistung in neuen Datensätzen führt. Die Maschine ist kalibriert, um MSE zu minimieren, und kann daher in Bezug auf die Vorhersage in einem neuen Datensatz besser abschneiden .
quelle