Angenommen, ich erstelle ein Vorhersagemodell, in dem ich versuche, mehrere Ereignisse vorherzusagen (z. B. Würfelwurf und Münzwurf). Die meisten Algorithmen, mit denen ich vertraut bin, arbeiten mit nur einem Ziel, daher frage ich mich, ob es einen Standardansatz für solche Dinge gibt.
Ich sehe zwei mögliche Optionen. Der vielleicht naivste Ansatz wäre, sie einfach als zwei verschiedene Probleme zu behandeln und dann die Ergebnisse zu kombinieren. Dies hat jedoch schwerwiegende Nachteile, wenn die beiden Ziele nicht unabhängig sind (und in vielen Fällen sehr abhängig sein können).
Ein vernünftigerer Ansatz für mich wäre es, ein kombiniertes Zielattribut zu erstellen. Im Falle eines Würfels und einer Münze hätten wir also Zustände ( usw.). Dies kann jedoch dazu führen, dass die Anzahl der Zustände / Klassen im zusammengesetzten Ziel ziemlich schnell größer wird (was wäre, wenn wir 2 Würfel usw. hätten). Darüber hinaus erscheint dies in dem Fall seltsam, in dem ein Attribut kategorial ist, während das andere numerisch ist (zum Beispiel wenn Temperatur und Niederschlagsart vorhergesagt werden).
Gibt es einen Standardansatz für solche Dinge? Alternativ gibt es Lernalgorithmen, die speziell dafür entwickelt wurden?
quelle
Antworten:
Dies ist in der Community für maschinelles Lernen als "Multi-Label-Lernen" bekannt. Es gibt verschiedene Ansätze für das Problem, einschließlich derer, die Sie in Ihrer Frage beschreiben. Einige Ressourcen für den Einstieg:
quelle
Wenn Sie zwei Variablen mit denselben Prädiktoren haben und die Variable B auch die Variable A als Prädiktor hat, sehen Sie möglicherweise ein Optimierungsproblem, bei dem Sie die Schätzungen von A und B gleichzeitig optimieren möchten. Es macht keinen Sinn, eine zu optimieren, wenn Sie dann eine schlechte Schätzung für die zweite erhalten.
Dies wäre ein Operations-Research-Problem und liegt leider außerhalb meines Fachgebiets.
quelle