Stellen Sie sich ein Standard-Szenario für maschinelles Lernen vor:
Sie werden mit einem großen multivariaten Datensatz konfrontiert und haben ein ziemlich verschwommenes Verständnis davon. Was Sie tun müssen, ist, Vorhersagen über eine Variable zu treffen, die auf Ihren Vorstellungen basiert. Wie üblich bereinigen Sie die Daten, sehen sich beschreibende Statistiken an, führen einige Modelle aus, validieren sie gegenseitig usw., aber nach mehreren Versuchen, hin und her zu gehen und mehrere Modelle auszuprobieren, scheint nichts zu funktionieren und Ihre Ergebnisse sind miserabel. Sie können Stunden, Tage oder Wochen mit einem solchen Problem verbringen ...
Die Frage ist: wann aufhören? Woher wissen Sie , dass Ihre Daten tatsächlich hoffnungslos sind und alle ausgefallenen Modelle Ihnen nichts nützen würden, als das durchschnittliche Ergebnis für alle Fälle oder eine andere triviale Lösung vorherzusagen?
Natürlich ist dies eine Frage der Prognosefähigkeit, aber meines Wissens ist es schwierig, die Prognosefähigkeit für multivariate Daten zu beurteilen, bevor Sie etwas ausprobieren. Oder liege ich falsch?
Haftungsausschluss: Diese Frage wurde von dieser inspiriert. Wann muss ich aufhören, ein Modell zu suchen? das hat nicht viel aufmerksamkeit erregt. Es wäre schön, eine detaillierte Antwort auf diese Frage zu haben.
Antworten:
Prognostizierbarkeit
Sie haben Recht, dass dies eine Frage der Prognostizierbarkeit ist. Es gab ein paar Artikel über Vorhersagbarkeit in der Praktiker-orientierte Zeitschrift IIF Foresight . (Vollständige Offenlegung: Ich bin Associate Editor.)
Das Problem ist, dass die Prognostizierbarkeit in "einfachen" Fällen bereits schwer einzuschätzen ist.
Einige Beispiele
Angenommen, Sie haben eine Zeitreihe wie diese, sprechen aber kein Deutsch:
Wie würden Sie den großen Peak im April modellieren und wie würden Sie diese Informationen in Prognosen einbeziehen?
Wenn Sie nicht wüssten, dass es sich bei dieser Zeitreihe um den Verkauf von Eiern in einer Schweizer Supermarktkette handelt, der kurz vor Ostern im Westkalender seinen Höhepunkt erreicht , hätten Sie keine Chance. Da sich Ostern um bis zu sechs Wochen im Kalender bewegt, müssen alle Prognosen, die kein spezifisches Osterdatum enthalten, berücksichtigt werden. wäre wohl sehr dran.
Angenommen, Sie haben die blaue Linie unten und möchten das, was am 28.02.2010 passiert ist, anders modellieren als "normale" Muster am 27.02.2010:
Ohne zu wissen, was passiert, wenn eine ganze Stadt voller Kanadier ein olympisches Eishockey-Endspiel im Fernsehen sieht, haben Sie keine Chance zu verstehen, was hier passiert ist, und Sie können nicht vorhersagen, wann sich so etwas wiederholen wird.
Schauen Sie sich zum Schluss Folgendes an:
Dies ist eine Zeitreihe der täglichen Verkäufe in einem Cash & Carry- Geschäft. (Auf der rechten Seite haben Sie eine einfache Tabelle: 282 Tage hatten keinen Umsatz, 42 Tage hatten einen Umsatz von 1 ... und eines Tages einen Umsatz von 500.) Ich weiß nicht, um welchen Artikel es sich handelt.
Bis heute weiß ich nicht, was an diesem einen Tag mit einem Umsatz von 500 passiert ist. Ich vermute, dass ein Kunde eine große Menge des Produkts vorbestellt und abgeholt hat. Nun, ohne dies zu wissen, wird jede Vorhersage für diesen bestimmten Tag weit entfernt sein. Umgekehrt, nehmen wir an, dass dies kurz vor Ostern geschah und wir haben einen dummen intelligenten Algorithmus, der glaubt, dass dies ein Ostereffekt sein könnte (vielleicht sind das Eier?), Und prognostizieren glücklich 500 Einheiten für das nächste Ostern. Oh mein Gott, könnte das schief gehen?
Zusammenfassung
In allen Fällen sehen wir, wie die Prognosefähigkeit nur dann gut verstanden werden kann, wenn wir ein hinreichendes Verständnis der wahrscheinlichen Faktoren haben, die unsere Daten beeinflussen. Das Problem ist, dass wir, wenn wir diese Faktoren nicht kennen, nicht wissen, dass wir sie möglicherweise nicht kennen. Nach Donald Rumsfeld :
Wenn Ostern oder Kanadas Vorliebe für Hockey für uns unbekannte Unbekannte sind, stecken wir fest - und wir haben nicht einmal einen Ausweg, weil wir nicht wissen, welche Fragen wir stellen müssen.
Die einzige Möglichkeit, diese in den Griff zu bekommen, besteht darin, Domänenwissen zu sammeln.
Schlussfolgerungen
Daraus ziehe ich drei Schlussfolgerungen:
Die Quintessenz
Folgendes würde ich empfehlen, um Modelle zu bauen - und zu bemerken, wann man aufhören sollte:
Beachten Sie, dass ich es nicht befürworte, verschiedene Klassen von Modellen auszuprobieren, wenn Ihr ursprüngliches Modell Plateaus aufweist. Wenn Sie mit einem vernünftigen Modell angefangen haben, bringt die Verwendung eines anspruchsvolleren Modells in der Regel keinen großen Vorteil und kann einfach zu einer "Überanpassung des Test-Sets" führen. Ich habe das oft gesehen und andere Leute stimmen dem zu .
quelle
If you are forecasting a fair coin toss, then there is no way to get above 50% accuracy.
. Du hast dort alles gesagt.Die Antwort von Stephan Kolassa ist ausgezeichnet, aber ich möchte hinzufügen, dass es auch oft eine wirtschaftliche Stoppbedingung gibt:
Als Beispiel: Wir hatten einen Kunden, der vorhersagen wollte, wann seine Maschinen ausfallen. Wir analysierten vorhandene Daten und stellten im Wesentlichen Lärm fest. Wir haben uns eingehend mit dem Prozess befasst und festgestellt, dass die wichtigsten Daten nicht erfasst wurden und nur sehr schwer zu erfassen sind. Aber ohne diese Daten war unser Modell so arm, dass niemand es benutzt hätte und es wurde in Dosen aufbewahrt.
Während ich mich bei der Arbeit an einem kommerziellen Produkt auf die Wirtschaftlichkeit konzentrierte, gilt diese Regel auch für Hochschulen oder für Spaßprojekte - während Geld unter solchen Umständen weniger wichtig ist, ist Zeit immer noch ein seltenes Gut. Z.B. Im akademischen Bereich sollten Sie aufhören zu arbeiten, wenn Sie keine greifbaren Ergebnisse erzielen und wenn Sie andere, vielversprechendere Projekte haben, die Sie tun könnten. Aber lass das Projekt nicht fallen - bitte veröffentliche auch null oder "brauche mehr / andere Daten" Ergebnisse, sie sind auch wichtig!
quelle
Es geht auch anders. Frag dich selbst -
Wenn Sie zum Beispiel eine große Anzahl von Variablen mit verschiedenen Fußballmannschaften in Verbindung gebracht haben und vorhersagen wollten, wer gewinnen würde, könnten Sie sich Buchmacherquoten oder eine Art Crowd-Sourcing-Vorhersage ansehen, um sie mit den Ergebnissen Ihres maschinellen Lernens zu vergleichen Algorithmus. Wenn Sie besser sind, sind Sie vielleicht am Limit. Wenn es schlechter ist, gibt es natürlich Raum für Verbesserungen.
Ihre Fähigkeit zur Verbesserung hängt (weitgehend) von zwei Dingen ab:
Es hängt genau davon ab, was ich zu tun versuche, aber ich tendiere dazu, die Antworten auf diese Fragen zu verwenden, um die Richtung zu bestimmen, in die ich beim Erstellen eines Modells gehe, insbesondere, ob ich versuchen soll, mehr Daten zu extrahieren, die ich verwenden oder auf die ich mich konzentrieren kann versuchen, das Modell zu verfeinern.
Ich stimme Stephan zu, dass dies normalerweise am besten durch die Befragung eines Domain-Experten möglich ist.
quelle