Gibt es einen Algorithmus für maschinelles Lernen, der eine einzelne Eingabe einer Ausgabeliste variabler Länge zuordnet? Wenn ja, gibt es Implementierungen des Algorithmus für den öffentlichen Gebrauch? Wenn nicht, was empfehlen Sie als Problemumgehung?
In meinem Fall ist die Eingabe ein einzelner Skalar und die Ausgabe ist eine Liste von Skalaren mit variabler Länge. Angenommen, ich wollte eine Liste von Einsen mit der Länge der Liste als Eingabe ausgeben. Dann könnte <Eingabe, Ausgabe> <1, [1]>, <2, [1, 1]> usw. sein. Eine kleine Änderung würde die Quadratwurzel der Länge liefern, in welchem Fall <2, [1, 1 , 1, 1]> wäre eine Antwort. Hinweis: Der Eingang muss nicht direkt mit dem Ausgang verbunden sein.
Angenommen, ich möchte für ein komplexeres Beispiel die Look-and-Say-Sequenz lernen . Gültige <Eingabe, Ausgabe> -Paare wären: <1, [1]>, <2, [1, 1]>, <3, [2, 1]>, <4, [1, 2, 1, 1] >, <5, [1, 1, 1, 2, 2, 1]> usw. Mein Problem ist auch insofern ähnlich, als ich weitere Beispiele generieren kann. Ich bin nicht auf eine begrenzte Anzahl von Beispielen beschränkt.
machine-learning
ricksmt
quelle
quelle
Antworten:
Ich würde versuchen, einen Multilabel-Klassifizierungsalgorithmus festzulegen und den Ausgabestandard durch Hinzufügen von Nullen festzulegen . Wenn Ihre Daten also so sind: <1, 1 >, <2, [1, 1]>, <3, [2, 1]>, <4, [1, 2, 1, 1]>, <5 , [1, 1, 1, 2, 2, 1]>. Die maximale Anzahl der Ausgaben beträgt 6. Sie können Ihre Daten also in folgende Elemente umwandeln: <1, [1,0,0,0,0,0]>, <2, [1, 1,0,0,0, 0]>, <3, [2, 1,0,0,0,0]>, <4, [1, 2, 1, 1,0,0]>, <5, [1, 1, 1, 2, 2, 1]>
Eine andere Option, die mir einfällt, ist das dynamische Hinzufügen des Limits. Angenommen, Sie haben Ihr Trainings- und Test-Set. Sie können nach der größten Länge suchen und einen Algorithmus erstellen, der beiden Datensätzen die Nullen hinzufügt. Angenommen, neue Daten, die Sie vorhersagen möchten, haben eine größere Länge. Dann müssen Sie das gesamte Training neu berechnen und mit diesen neuen Tests testen. Sie können sogar überprüfen, wie sich die Erweiterung des Grenzwerts auf Ihr Modell auswirkt.
quelle
Also ein paar Möglichkeiten, die man sich vorstellen kann:
Es gibt wahrscheinlich andere, aber ich kann momentan nicht an sie denken.
quelle