Würde es ein Modellauswahlproblem geben, wenn wir Zugriff auf ein Orakel hätten, das uns den genauen Generalisierungsfehler gegeben hätte?

Sei eine Funktion, die bei gegebener Hypothese den Generalisierungsfehler für dieses feste zurückgibt . $\mathcal{E(h)}$ $h$ $h$

Ich habe einige Anmerkungen zur Modellauswahl und zum Generalisierungsfehler gelesen und darin stand:

"Wenn wir Zugriff auf , gäbe es auch kein Problem bei der Modellauswahl. Wir würden einfach die großen auswählen , um einen Klassifikator zu finden, der den Fehler minimiert." $\mathcal{E(h)}$ $\mathcal{H}$

Ich war mir nicht sicher, ob ich diese Aussage vollständig schätzte oder verstand oder tatsächlich mit der Aussage einverstanden war. Der Grund ist, dass es immer noch problematisch wäre, das Modell zu finden , selbst wenn wir Zugriff auf (was meiner Meinung nach ein Orakel bedeutet, das braucht und nur seinen wahren Generalisierungsfehler sagt) hat die Hypothese, die gut verallgemeinert. Der Grund ist, sagen wir, dass die Modellklassen unendlich sind (dh es gibt eine unendliche Menge von Modellen zur Auswahl). Wir wissen nicht wirklich, wann sein Minimum erreicht hat, es sei denn, wir prüfen für jedes $\mathcal{E(h)}$ $h$ $\mathcal{H}$ $\mathcal{E(h)}$ $\mathcal{H}$ das lässt sich machen. Das heißt, selbst wenn wir so etwas hätten, glaube ich nicht, dass das Problem so leicht beseitigt werden kann, denn wie können wir jemals sicher sein, dass wir wirklich das beste (in Polynomzeit)? Grundsätzlich geht die Frage davon aus, dass wir ein Orakel haben, um festzustellen, wann die Verallgemeinerung ebenfalls minimal ist. Darüber hinaus ist, wie ich bereits erwähnt habe, der vorgeschlagene Algorithmus / die vorgeschlagene Drehmaschine entscheidbar und nicht in P (dh er könnte für immer laufen ...). $\mathcal{H}$

Das Hauptproblem / der Hauptzweifel, den ich bei dieser Frage habe, ist, dass ich selbst bei einem solchen Oracle nicht davon überzeugt bin, dass die Modellauswahl trivialisiert wurde. Eine Antwort, die versucht, dieses spezielle Problem anzugehen, hat höhere Chancen, meine Frage besser anzugehen.

machine-learning model Pinocchio
quelle

Antworten:

Grundsätzlich geht die Frage davon aus, dass wir ein Orakel haben, um festzustellen, wann die Verallgemeinerung ebenfalls minimal ist.

Das zu haben wäre natürlich großartig. Ein Orakel zu haben, das uns das beste Modell gibt, wäre noch besser. Sie scheinen jedoch die Funktion des Orakels falsch zu interpretieren.

$\mathcal{E}(h)$ $\hat{\mathcal{E}}(h)$

Da wir ein Modell basierend auf seiner geschätzten Generalisierungsleistung auswählen müssen, haben wir keine Garantie für die Auswahl des richtigen Modells . Dies macht die Modellauswahl schwierig (und etwas willkürlich). Wenn wir Zugriff auf die tatsächliche Generalisierungsleistung hätten, wäre die Modellauswahl trivial.

$\mathcal{H}$

Dies ist eine schöne theoretische Frage, die jedoch etwas tangential zum praktischen Problem ist, da man normalerweise das beste Modell innerhalb einer endlichen Reihe von Optionen auswählen möchte.

Sie haben Recht, dass eine wirklich unendliche Menge von Modellen ein unentscheidbares Problem ergeben würde, ohne weitere Annahmen zu treffen. In der Praxis sind jedoch einige weitere Annahmen sinnvoll.

$\mathcal{E}(h)$

Marc Claesen
quelle

Ich denke, Ihre Antwort ist interessant, aber ich habe die folgende Behauptung, die Sie machen, nicht verstanden: "Sie scheinen die Funktion des Orakels falsch zu interpretieren." Sie geben dies nur an, ohne einen expliziten Grund dafür anzugeben, warum Sie das denken. Ich möchte dieses Problem nur besser verstehen, und ich denke, wenn Sie diesen Punkt erweitern oder klarstellen, wäre es schön, weil meine Frage mehr versucht, das genaue Problem anzugehen, ob es ein Modellauswahlproblem gibt oder nicht. Ich weiß, es wäre schön, ein solches Orakel zu haben, aber ich denke immer noch, dass das Problem der Modellauswahl nicht ganz trivial ist

Pinocchio

Wegen des Kommentars, den ich gemacht habe. Wie können wir selbst mit einem solchen Orakel den Modellauswahlprozess genau trivialisieren? Das ist der Aspekt, der mir noch nicht klar ist oder von dem ich nicht überzeugt bin. Es scheint mir, dass ich, selbst wenn wir ein solches Orakel hätten, immer noch keinen Weg finden kann, die Modellauswahl zu trivialisieren, ohne eine Drehmaschine zu haben, die in einer Endlosschleife laufen könnte.

Pinocchio

oder vielleicht, wie Sie sagten, der Grund, warum ich Probleme habe, dies zu verstehen, ist, dass ich das Orakel, von dem die ursprünglichen Sätze sprechen, möglicherweise falsch verstanden habe.

Pinocchio