Kaggle-Wettbewerbe bestimmen die endgültigen Platzierungen auf der Grundlage eines durchgehaltenen Testsatzes.
Ein durchgehaltener Testsatz ist eine Stichprobe; Es kann sein, dass es nicht repräsentativ für die zu modellierende Population ist. Da jede Einsendung wie eine Hypothese ist, hat der Algorithmus, der den Wettbewerb gewonnen hat, möglicherweise den Testsatz besser als die anderen getroffen. Mit anderen Worten, wenn ein anderer Testsatz ausgewählt und der Wettbewerb wiederholt würde, würden die Platzierungen gleich bleiben?
Für das Sponsoring-Unternehmen ist dies nicht wirklich wichtig (wahrscheinlich würden die Top-20-Einsendungen ihre Basislinie verbessern). Ironischerweise könnten sie jedoch ein Modell der ersten Reihe verwenden, das schlechter ist als die anderen Top 5. Für die Teilnehmer des Wettbewerbs scheint Kaggle letztendlich ein Glücksspiel zu sein - Glück ist nicht erforderlich, um über die richtige Lösung zu stolpern, es ist erforderlich, über die Lösung zu stolpern, die zum Test-Set passt!
Ist es möglich, den Wettbewerb so zu ändern, dass alle Spitzenteams, die statistisch nicht zu unterscheiden sind, gewinnen? Oder könnte in dieser Gruppe das sparsamste oder rechnerisch billigste Modell gewinnen?
Antworten:
Ja, Ihre Argumentation ist richtig. Wenn ein anderer Testsatz ausgewählt und der Wettbewerb wiederholt würde, würde sich die Rangfolge in der Tat ändern. Betrachten Sie das folgende Beispiel. Alle Einträge zu einem Kaggle-Wettbewerb mit binären Labels raten einfach zufällig (und zum Beispiel unabhängig), um ihre Ausgabe vorherzusagen. Durch Zufall wird einer von ihnen mehr als andere mit dem Holdout einverstanden sein, obwohl keine Vorhersage getroffen wird.
Dies ist zwar ein wenig erfunden, aber wir können sehen, dass Abweichungen in den einzelnen Modellen der Einreichung bedeuten, dass das Anwenden vieler solcher Einträge in der Tat nur zum Rauschen des Holdout-Sets passt. Dies sagt uns, dass (abhängig von den einzelnen Modellabweichungen) die Top-N-Modelle wahrscheinlich dasselbe verallgemeinern. Dies ist der Garten der Gabelpfade , mit der Ausnahme, dass die "Forscher" nicht gleich sind (aber das spielt keine Rolle).
Tatsächlich.
quelle
Es gibt andere Arten von Wettbewerben, bei denen Kaggle keine Zufallselemente hat. Zum Beispiel der gestohlene Schlitten dieses Stanta .
Es ist ein diskretes Optimierungsproblem und es gibt sogar keine private Rangliste. Was Sie in der öffentlichen Rangliste sehen, ist das Endergebnis.
Im Vergleich zu betreutem Lernen, das für viele Menschen einen einfachen Start hat, ist diese Art von Wettbewerb "härter".
quelle