Im Kontext des maschinellen Lernens habe ich gesehen, dass der Begriff " Grundwahrheit" häufig verwendet wird. Ich habe viel gesucht und folgende Definition in Wikipedia gefunden :
Beim maschinellen Lernen bezieht sich der Begriff "Grundwahrheit" auf die Genauigkeit der Klassifizierung des Trainingssatzes für überwachte Lerntechniken. Dies wird in statistischen Modellen verwendet, um Forschungshypothesen zu beweisen oder zu widerlegen. Der Begriff "Bodenuntersuchung" bezieht sich auf den Prozess des Erfassens der richtigen objektiven (nachweisbaren) Daten für diesen Test. Vergleichen Sie mit Goldstandard.
Die Bayes'sche Spam-Filterung ist ein weit verbreitetes Beispiel für überwachtes Lernen. In diesem System werden dem Algorithmus die Unterschiede zwischen Spam und Nicht-Spam manuell beigebracht. Dies hängt von der Grundwahrheit der zum Trainieren des Algorithmus verwendeten Nachrichten ab - Ungenauigkeiten in der Grundwahrheit korrelieren mit Ungenauigkeiten in den resultierenden Spam- / Nicht-Spam-Urteilen.
Der Punkt ist, dass ich wirklich nicht verstehen kann, was es bedeutet. Ist das die Bezeichnung für jedes Datenobjekt oder die Zielfunktion, die jedem Datenobjekt eine Bezeichnung gibt , oder vielleicht etwas anderes?
Grundwahrheit: Dies ist die Realität, die Ihr Modell vorhersagen soll.
Es kann etwas Rauschen geben, aber Sie möchten, dass Ihr Modell das zugrunde liegende Muster in Daten lernt, die diese Grundwahrheit verursachen. In der Praxis wird Ihr Modell niemals in der Lage sein, die Grundwahrheit vorherzusagen, da die Grundwahrheit auch ein gewisses Rauschen aufweist und kein Modell hundertprozentige Genauigkeit bietet, Sie jedoch möchten, dass Ihr Modell so nah wie möglich ist.
quelle