Ist die Regression mit L1-Regularisierung gleichbedeutend mit Lasso und mit L2-Regularisierung gleichbedeutend mit Ridge-Regression? Und wie schreibt man „Lasso“?

33

Ich bin ein Software-Ingenieur, der maschinelles Lernen lernt, insbesondere durch die maschinellen Lernkurse von Andrew Ng . Beim Studium der linearen Regression mit Regularisierung habe ich Begriffe gefunden, die verwirrend sind:

  • Regression mit L1-Regularisierung oder L2-Regularisierung
  • LASSO
  • Gratregression

Also meine Fragen:

  1. Ist die Regression mit L1-Regularisierung genau das gleiche wie mit LASSO?

  2. Ist die Regression mit L2-Regularisierung genau die gleiche wie die Ridge-Regression?

  3. Wie wird "LASSO" schriftlich verwendet? Sollte es "LASSO Regression" sein? Ich habe Verwendung wie " das Lasso ist angemessener " gesehen.

Wenn die Antwort "Ja" für 1 und 2 oben ist, warum gibt es dann unterschiedliche Namen für diese beiden Begriffe? Kommen "L1" und "L2" aus der Informatik / Mathematik und "LASSO" und "Ridge" aus Statistiken?

Die Verwendung dieser Begriffe ist verwirrend, wenn ich Posts wie die folgenden sehe:

" Was ist der Unterschied zwischen L1- und L2-Regularisierung? " (Quora.com)

" Wann sollte ich Lasso vs Ridge verwenden? " (Stats.stackexchange.com)

stackoverflowuser2010
quelle
Obwohl ich spät antworte. Dieser umfassende Leitfaden für Anfänger zur linearen, Ridge- und Lasso-Regression hilft den Anfängern, diese Begriffe klar zu verstehen. Sehen Sie hier
Anfänger

Antworten:

34
  1. Ja.

  2. Ja.

  3. LASSO ist eigentlich ein Akronym (am wenigsten absoluter Schrumpfungs- und Auswahloperator), sollte also groß geschrieben werden, aber modernes Schreiben ist das lexikalische Äquivalent von Mad Max . Auf der anderen Seite schreibt Amoeba, dass sogar die Statistiker, die den Begriff LASSO geprägt haben, jetzt die Kleinschreibung verwenden (Hastie, Tibshirani und Wainwright, Statistical Learning with Sparsity ). Über die Motivation für den Wechsel kann man nur spekulieren. Wenn Sie für eine akademische Presse schreiben, haben sie in der Regel einen Styleguide für diese Art von Dingen. Wenn Sie in diesem Forum schreiben, ist beides in Ordnung, und ich bezweifle, dass sich jemand wirklich darum kümmert.

Die Notation bezieht sich auf Minkowski-Normen und Räume. Diese verallgemeinern lediglich den Begriff der Taxi- und euklidischen Abstände zu im folgenden Ausdruck: Wichtig ist, dass nur einen metrischen Abstand definiert. erfüllt die Dreiecksungleichung nicht, ist also nach den meisten Definitionen keine Distanz.LLpp>0

xp=(|x1|p+|x2|p+...+|xn|p)1p
p10<p<1

Ich bin nicht sicher, wann die Verbindung zwischen Kamm und LASSO realisiert wurde.

Warum es mehrere Namen gibt, ist nur eine Frage, dass diese Methoden zu unterschiedlichen Zeiten an verschiedenen Orten entwickelt wurden. Ein häufiges Thema in der Statistik ist, dass Konzepte häufig mehrere Namen haben, einen für jedes Unterfeld, in dem sie unabhängig entdeckt wurden (Kernfunktionen vs. Kovarianzfunktionen, Gaußsche Prozessregression vs. Kriging, AUC vs. Statistik). Die Ridge-Regression sollte wahrscheinlich als Tikhonov-Regularisierung bezeichnet werden, da ich glaube, dass er den frühesten Anspruch auf die Methode hat. In der Zwischenzeit wurde LASSO erst 1996 eingeführt, viel später als die "Grat" -Methode von Tikhonov!c

Sycorax sagt Reinstate Monica
quelle
6
+1. Hastie, Tibshirani und Wainwright verwenden in dem kürzlich erschienenen Lehrbuch " Statistical Learning with Sparsity " überall "Lasso" in Kleinbuchstaben und schreiben außerdem Folgendes (Fußnote auf Seite 8): "Ein Lasso ist ein langes Seil mit einer Schlinge an einer Im übertragenen Sinne bezeichnet die Methode „Lassos" die Koeffizienten des Modells. Im ursprünglichen Lasso-Papier (Tibshirani 1996) wurde der Name „Lasso" auch als Akronym für „Least Absolute" eingeführt Auswahl- und Schrumpfungsoperator. ”(CC to @ stackoverflowuser2010.)
Amöbe sagt Reinstate Monica
3
Und sie fahren fort: "Aussprache: In den USA wird" Lasso "in der Regel als" Lass-oh "(oh wie bei Ziege) ausgesprochen, während in Großbritannien" Lass-oo "in der OED (2. Auflage, 1965):" Lasso wird von denjenigen, die es benutzen, und auch von den meisten Engländern als lasoo ausgesprochen. “" :-)
amoeba sagt Reinstate Monica
4
(+1) Wenn die eigentlichen Akronyme (die als Wörter ausgesprochenen Abkürzungen) an Bedeutung gewinnen, wird die Groß- und Kleinschreibung in der Regel vom Board übernommen. Es ist schon eine Weile her, dass ich "RADAR" oder "LASER" gesehen habe.
Scortchi
2
@ Scortchi SCUBA auch. In der Zwischenzeit schreiben Leute STATA und MATLAB, als ob sie Akronyme wären.
Shadowtalker
2
@ssdecontrol: Soll "ANOVA" dann "AnOVa" sein?
Scortchi