Ist der R-Quadrat-Wert zum Vergleichen von Modellen geeignet?

17

Ich versuche, das beste Modell zu finden, um die Preise für Automobile vorherzusagen. Dabei verwende ich die Preise und Funktionen, die auf Websites für Kleinanzeigen für Automobile verfügbar sind.

Dazu verwendete ich einige Modelle aus der Scikit-Learn-Bibliothek und neuronale Netzwerkmodelle aus Pybrain und Neurolab. Der Ansatz, den ich bisher verwendet habe, besteht darin, eine feste Datenmenge durch einige Modelle (Algorithmen für maschinelles Lernen) zu führen und dort Werte zu vergleichen, die mit dem Modul "scikit-learn metrics" berechnet wurden.R2

  1. Ist eine gute Methode, um die Leistung verschiedener Modelle zu vergleichen?R2
  2. Obwohl ich für Modelle wie das elastische Netz und zufällige Wälder akzeptable Ergebnisse erzielt habe, habe ich für neuronale Netzmodelle sehr schlechte Werte erhalten. Ist eine geeignete Methode zur Bewertung neuronaler Netze (oder nichtlinearer Methoden)?R 2R2R2
Manik
quelle
2
Die kurze Antwort lautet nein . Es könnte Ihnen helfen, meine Antwort hier zu lesen: Modellbewertung und -vergleich zur Auswahl des besten Modells , das ziemlich eng mit Ihrer Frage zusammenhängt. Eine mögliche Lösung wird hier beschrieben . Für ein allgemeineres Verständnis können Sie versuchen, einige der Threads auf der Site zu lesen, die unter dem Modellauswahl- Tag kategorisiert sind .
gung - Wiedereinsetzung von Monica
@gung Danke! Darf ich fragen, was ein angemessenes Maß für die Anpassungsgüte für die Regression mit neuronalen Netzen wäre?
Manik

Antworten:

18

Ich denke, der entscheidende Punkt bei der Beantwortung Ihrer Frage ist

Ich versuche, das beste Modell zu finden, um die Preise für Automobile vorherzusagen

weil diese Aussage etwas darüber impliziert, warum Sie das Modell verwenden möchten. Die Auswahl und Bewertung des Modells sollte auf dem basieren, was Sie mit Ihren angepassten Werten erreichen möchten.

Lassen Sie uns zunächst noch einmal zusammenfassen, was tutR2 : Es berechnet ein skaliertes Maß basierend auf der quadratischen Verlustfunktion, die Sie sicher bereits kennen. Um dies zu sehen, definiert Rest für die i-te Beobachtung y i und der entsprechenden Einbau Wert y i . Unter Verwendung der Notation bequeme S S R : = Σ N i = 1 e 2 i , S S T : = Σeich=yich-y^ichyichy^ichSSR: =ich=1Neich2,R2einfach als definiertR2=1-SSR/SST.SST: =ich=1N(yich-y¯)2R2R2=1-SSR/SST

Zweitens wollen wir sehen, was die Verwendung von für die Modellauswahl / -bewertung bedeutetR2 . Angenommen, wir wählen aus einer Reihe von Vorhersagen , die unter Verwendung eines Modells M generiert wurden : M M , wobei M die Sammlung der betrachteten Modelle ist (in Ihrem Beispiel würde diese Sammlung neuronale Netze, zufällige Wälder, elastische Netze, ...). Da S S T unter allen Modellen konstant bleibt, wählen Sie beim Minimieren von R 2 genau das Modell, das S S R minimiert . Mit anderen Worten, Sie werden wählenY.¯MM:MMMSSTR2SSR , das den minimalen quadratischen Fehlerverlust erzeugt!MM

R2SSR L2L1

R2Lp1p<2p=1LpLp

Zusammenfassend kann die Modellauswahl / -bewertung nicht unabhängig vom Ziel des Modells betrachtet werden.

Jeremias K
quelle