Bis vor kurzem dachte ich, dass "Kennzeichnung" und "Klassifizierung" Synonyme sind. Aber als ich eine andere Frage zur Terminologie in der Bildverarbeitung stellte, dachte ich darüber nach: Gibt es einen Unterschied zwischen "Kennzeichnung" und "Klassifizierung"?
Ich dachte, dass die "Klasse" das Konzept ist, das Sie erkennen möchten, und "Label" ist das, was Sie Daten zuweisen. Die "Klasse" ist also ein Konzept, das zu den Daten führt, und "Label" ist nur der Name. Daher wäre "Kennzeichnung" dasselbe wie "Klassifizierung", da beide eine Aussage über die zugrunde liegende Klasse machen möchten, die zu den Daten führt.
Artikel
Eine schnelle Suche über Google Scholar ergab, dass einige Artikel beide Begriffe im Titel verwenden:
- Markus Eich, Malgorzata Dabrowska und Frank Kirchner: "Semantische Kennzeichnung: Klassifizierung von 3D-Entitäten anhand räumlicher Merkmalsdeskriptoren"
- Chunlin Li, Dmitry B. Goldgof und Lawrence 0. Hall: "Wissensbasierte Klassifizierung und Gewebekennzeichnung von MR-Bildern des menschlichen Gehirns"
- Ray Blanchard: "Die Klassifizierung und Kennzeichnung von nicht homosexuellen Geschlechtsdysphorien" - ein weiteres Forschungsgebiet, aber wahrscheinlich ist es der gleiche Unterschied zwischen den beiden Wörtern?
Ich denke, es gibt einen Unterschied zwischen "Kennzeichnung" und "Klassifizierung". Was ist der Unterschied?
Google N-Gram
Klassifizierung scheint ein viel Grenzbegriff zu sein.
quelle
Antworten:
Stimme @Derek Janni überhaupt nicht zu. Seien Sie vorsichtig mit der Notation, aber Sie sollten sich nicht in der Terminologie verlieren. In den von Ihnen erwähnten Artikeln wurde der Begriff "Kennzeichnung" wörtlich verwendet, aber in der Community für maschinelles Lernen / Data Mining ist Kennzeichnung der Prozess der Vorbereitung von Daten für das überwachte Lernen (Klassifizierung)! Es hat nichts mit der ML-Aufgabe zu tun!
In diesen Artikeln wurde der Begriff verwendet, um zu zeigen, dass sie nach überwachtem Lernen unterschiedliche Bezeichnungen verschiedener Objekte erkennen können, sodass sie den Begriff Kennzeichnung verwenden. In keiner Literatur finden Sie jedoch wahrscheinlich, dass diese beiden Begriffe als Synonyme verwendet werden.
quelle
So wie ich es sehe: 'Klassifizierung' (im Kontext des maschinellen Lernens) ist eine Art Problem, bei dem Sie einem Objekt eine 'Bezeichnung' zuweisen. Formal ist 'Klassifizierung' eine Art Problem, während die Beschriftung eine Funktion von einem Objekt zu einer Reihe von Beschriftungen (möglicherweise unendlich) ist.
Ähnlich wie Regression ist eine Art von Problem, bei dem Sie einem Objekt erneut eine Beschriftung zuweisen, nur diesmal ist die Beschriftung eine reelle Zahl.
Sowohl in der Klassifizierung als auch in der Regression versuchen Sie, die 'beste' Beschriftungsfunktion in Bezug auf eine Metrik- / Verlustfunktion zu finden.
quelle
Nachdem ich viel mehr Artikel gelesen und mit vielen Menschen über maschinelles Lernen gesprochen habe, würde ich die Wörter so definieren:
Eine Klasse als abstraktes Konzept, das existiert. Jede Klasse hat Eigenschaften und kann viele verschiedene Bezeichnungen haben. Zum Beispiel ist die Klasse Katze hat die Eigenschaften „Füße“ (mit dem Wert 4), die Eigenschaft „Genus“ mit dem Wert „Felis“. Es gibt viele Möglichkeiten, wie Mitglieder der Klasse aussehen können. Auch viele Etiketten: Katze, Katze, Felis silvestris, 🐱, 🐈.
Ein Etikett ist nur ein Aufkleber, den Sie auf das Konzept kleben. Ein Name. Wir brauchen ein Wort, um über das Konzept sprechen zu können.
Ich verwende die Beschriftung für den manuellen Prozess zum Definieren, welche Teile des Datensatzes zu welcher Klasse gehören. Und ich verwende die Klassifizierung für den Prozess des automatischen Klassifizierers, der entscheidet, welcher Teil der Daten zu welcher Klasse gehört. In der Regel erfolgt die Kennzeichnung durch einen Menschen und erfolgt über die Klassifizierung, die von der Maschine durchgeführt wird.
quelle
Kurze Antwort:
Nein, es gibt keinen Unterschied zwischen Kennzeichnung und Klassifizierung.
Klasse - eine Menge oder Kategorie von Dingen, die eine Eigenschaft oder ein Attribut gemeinsam haben und sich von anderen nach Art, Typ oder Qualität unterscheiden. Siehe 'Kategorie'.
Bezeichnung - Wort oder Ausdruck, der angibt, dass das Folgende zu einer bestimmten Kategorie oder Klasse gehört.
Etwas zu klassifizieren heißt es zu kennzeichnen, sie sind notwendigerweise dasselbe. Der Begriff Kennzeichnung hat sich wahrscheinlich entwickelt, weil Sie mit "Beschriftung" vermeiden können, "Klasse" zu sagen, die in der Informatik andere Konnotationen hat.
Die Beschriftung ist viel einfacher, und in allen Fällen ist die Klassifizierung nur das Aufbringen von Beschriftungen auf Objekte (oder das Erlernen der korrekten Ausführung).
Die Diskrepanz, die Sie bei der Verwendung der Kennzeichnung / Klassifizierung sehen, beruht auf der einfachen Tatsache, dass ein Titel wie:
"Semantische Klassifikation: Klassifikation von 3D-Entitäten basierend auf räumlichen Merkmalsdeskriptoren" oder "Wissensbasierte Klassifikation und Gewebeklassifikation von MR-Bildern des menschlichen Gehirns"
Hört sich wirklich unangenehm an.
Wie bei den meisten akademischen Papiertiteln handelt es sich hierbei nur um zu komplexe Beschreibungen der Artikel, die genau erklären, was vor sich geht, ohne überflüssig zu klingen.
TL; DR - Lass dich nicht auf Terminologie ein!
quelle
Beschriftungen werden in Verbindung mit der Klassifizierung verwendet, wenn das Objekt nicht zu einer einzelnen Klasse, sondern zu einer breiteren Gruppe gehört, daher der Begriff "Multilabel-Lernen" oder "Multilabel-Klassifizierung". Da sie sich auf diskrete Klassen beziehen, können sie synonym verwendet werden. Ich würde jedoch empfehlen, die traditionelle Terminologie ( Klassifizierung, wenn eine einzelne Klasse zugewiesen werden soll) zu verwenden, um Verwirrung zu vermeiden.
quelle