Wie interpretiere ich den Plot von cv.glmnet ()?

8

Ich führte Lasso durch und ließ dann eine einmalige Kreuzvalidierung aus

cv<-cv.glmnet(df, df$Price, nfolds = 1500) 

Wenn ich einen Lebenslauf zeichne, erhalte ich Folgendes: Geben Sie hier die Bildbeschreibung ein

Mir ist auch aufgefallen, dass ich 2 verschiedene Lambdas bekomme: lambda.minundlambda.1se

  • Was ist der Unterschied zwischen diesen Lambdas?
  • Was kann ich aus der obigen Darstellung im Allgemeinen verstehen (worum geht es in diesen Konfidenzintervallen, was sind die beiden gepunkteten Linien usw.)?

Wenn ich zu nfolds=10einer 10-fachen Validierung wechsle , erhalte ich unterschiedliche lambda.1seund unterschiedliche Koeffizienten für dieses Lambda. Basierend auf welchem ​​Kriterium kann ich das Beste für mich auswählen?

Jasmin
quelle
2
Haben Sie versucht, hier zu suchen: web.stanford.edu/~hastie/glmnet/glmnet_alpha.html
ilanman
@ilanman Das ist toll, danke! Aber welches Lambda soll ich noch bevorzugen? Meine Intuition würde lambda.min sagen, aber ich sehe, dass lambda.1se normalerweise vorgeschlagen wird ..
Jasmine

Antworten:

16

Hier geht es nicht wirklich um Statistiken, sondern nur um das Lesen der Dokumentation.

  • λλλminλ1seλλminλ1seλ
  • Konfidenzintervalle stellen Fehlerschätzungen für die Verlustmetrik dar (rote Punkte). Sie werden mit Lebenslauf berechnet. Die vertikalen Linien zeigen die Positionen von und . Die Zahlen oben sind die Anzahl der Koeffizientenschätzungen ungleich Null.λminλ1se
Sycorax sagt Reinstate Monica
quelle