Definition eines Modells im maschinellen Lernen

11

Diese Definition trifft nicht ganz zu, da wir nicht immer von einer zugrunde liegenden Verteilung ausgehen. Was ist ein Modell wirklich? Kann ein GBM mit bestimmten Hyperparametern als Modell betrachtet werden? Ist ein Modell eine Sammlung von Regeln?

organische Agave
quelle
1
Sie könnten nur einen Schritt weiter gehen und sich en.wikipedia.org/wiki/Mathematical_model ansehen - die meisten ML-Modelle stimmen mit dieser Definition überein, auch wenn sie nicht mit dem "statistischen Modell" übereinstimmen (obwohl ich denke, dass fast alle unbeaufsichtigt oder trainiert sind) überwachte ML-Modelle würden als statistische Modelle betrachtet).
Neil Slater

Antworten:

7

Ich habe mich kürzlich für dieselbe Frage interessiert und bin zu der Erkenntnis gekommen, dass es beim maschinellen Lernen keine einheitliche Definition eines "Modells" gibt. Dies hängt in hohem Maße von den Quellen ab, die Sie konsultieren. Dies kann die Dokumentation für ein bestimmtes Softwareprogramm, der von der Benutzergemeinschaft verwendete Slang oder die in veröffentlichten wissenschaftlichen Artikeln verwendeten Definitionen sein, die von Zeitschrift zu Zeitschrift sehr unterschiedlich sein können. Außerdem musste ich lernen zu bedenken, dass solche Artikel nicht nur von Spezialisten für maschinelles Lernen verfasst wurden, sondern auch von Experten anderer Disziplinen, die maschinelle Lerntechniken anwenden müssen (wie Bildgebung, verschiedene medizinische Bereiche usw.). . Viele von ihnen definieren den Begriff "Modell", der häufig lose verwendet wird, nicht explizit. Hier sind nur ein paar verschiedene Definitionen von "Modell" I '

• Statistische Modelle, insbesondere die Statistiken zu Wahrscheinlichkeitsverteilungen.

• Regressionsdaten und zugehörige Statistiken.

• Mathematische Modelle wie oben von Neil Slater erwähnt.

• Die beim maschinellen Lernen verwendeten Datenmodelle wie die beteiligten Spalten, ihre Datentypen, die Datenquellen und andere Metadaten. Dies ist besonders schwierig, da diese Definition im Gegensatz zu den ersten drei, die ich aufgelistet habe, überhaupt nichts Mathematisches enthält. Ein Beispiel finden Sie in der gesamten Dokumentation zu SQL Server-Miningmodellen, die für maschinelles Lernen doppelte Aufgaben erfüllen.

• Manchmal werden alle oben genannten Definitionen um maschinelle Lernstrukturen erweitert, die auf den Gleichungen und den Metadaten aufbauen, z. B. die Spezifikationen neuronaler Netze. In anderen Fällen werden diese als separate Einheiten betrachtet.

Alle oben genannten Elemente werden je nach Quelle manchmal gemischt und aufeinander abgestimmt. Ich bin sicher, dass es andere Definitionen von "Modell" gibt, die ich von dieser Liste weggelassen habe, was die Sache noch komplizierter machen wird. Um mit dieser Zweideutigkeit umzugehen, versuche ich, mich darin zu üben, die Absichten des Autors zu erraten, wenn sie den Begriff "Modell" verwenden. Manchmal ist es einfach, anhand des Kontexts oder des Feldes zu bestimmen, in dem der Autor arbeitet, aber manchmal muss ich einen Artikel oder eine Dokumentation gründlich lesen, bevor ich es herausfinde. Ich wünschte, ich könnte definitiver darüber sein, aber es ist wirklich ein natürlich unscharfer Begriff; Es wird nie eine einfache Antwort auf diese Frage geben. Ich hoffe das hilft.

SQLServerSteve
quelle
1
Während der Begriff "Modell" tatsächlich für viele Dinge gelten kann, ist das Modell im Kontext des maschinellen Lernens das Artefakt, das durch Lernen / Training erzeugt wird - z. B. im Fall von neuronalen Netzen die Gewichte und Vorurteile dieses Netzwerks.
Syzygy
5

Ich mag die Definition für maschinelles Lernen von Tom Mitchell .

Ein Computerprogramm soll aus lernen Erfahrung E bezüglich einer Klasse von Tasks T und Leistungsmaßnahme P , als ob seine Leistung bei Aufgaben in T, die von P gemessen, verbessert sich mit Erfahrung E.

Angesichts dieser Definition sollte ich also sagen, dass ein Modell die erworbene Erfahrung nach Abschluss einer Klasse T ist.

omar
quelle
Ist die Erfahrung E nicht das Trainingsset?
Itamar Mushkin
4

Aus dem Artikel über Amazon Machine Learning

Der Prozess des Trainings eines ML-Modells umfasst das Bereitstellen eines ML-Algorithmus (dh des Lernalgorithmus) mit Trainingsdaten, aus denen gelernt werden kann. The term ML model refers to the model artifact that is created by the training process.

Vlad Bezden
quelle
2

Ein Modell ist im Grunde genommen eine Vereinfachung einer Sache oder eines Prozesses. Zum Beispiel ist die Form der Erde eigentlich keine Kugel, aber wir könnten sie als eine behandeln, wenn wir einen Globus entwerfen. Unter der Annahme, dass das Universum deterministisch ist, gibt es einen natürlichen Prozess, der bestimmt, ob ein Kunde ein Produkt auf einer Website kauft. Wir könnten etwas konstruieren, das diesem Prozess nahe kommt, das wir einige Informationen über einen Kunden geben könnten und das uns sagt, ob es glaubt, dass der Kunde ein Produkt kaufen wird.

Ein "maschinelles Lernmodell" ist also ein Modell, das von einem maschinellen Lernsystem konstruiert wird.

(Entschuldigung, dass dies keine strenge Antwort ist, aber ich hoffe, dass dies immer noch nützlich ist.)

Ceasar Bautista
quelle
1

Im Paradigma des maschinellen Lernens bezieht sich das Modell auf einen mathematischen Ausdruck von Modellparametern zusammen mit Eingabeplatzhaltern für jede Vorhersage, Klasse und Aktion für Regressions-, Klassifizierungs- bzw. Verstärkungskategorien.

Dieser Ausdruck ist als Modell in das einzelne Neuron eingebettet.

Für einschichtiges Perzeptron- und Deep-Learning-Modell muss dieses Modell extrahiert werden, indem die Neuronen und Schichten vorsichtig durchlaufen werden, um die Aktivierungsfunktion in geordneter Weise zu sammeln und zu nähen.

cppRohit
quelle
0

Beim maschinellen Lernen ist das Modell der Schwerpunkt und alles dreht sich um das Modell. Obwohl verschiedene Personen unterschiedliche Definitionen des Modells haben. Aber meiner Meinung nach können wir hier am besten das Modell definieren: "Modell beim maschinellen Lernen ist die Hypothese, die versucht, die Daten anzupassen und zu lernen, die unsichtbaren Daten vorherzusagen."

Awais Bajwa
quelle