Was sind

12

Ich habe in letzter Zeit viele Artikel über spärliche Darstellungen gesehen, und die meisten von ihnen verwenden die p Norm und führen einige Minimierungen durch. Meine Frage ist, was ist die p Norm und die p,q Mischnorm? Und wie sind sie für die Regularisierung relevant?

Vielen Dank

Wasser
quelle

Antworten:

13

Normen sind Funktionen, die Vektoren nehmen und nichtnegative Zahlen zurückgeben. Sie sind definiert alsxp = ( d i = 1 | x i | p ) 1 / p In dem Fall, in dem p = 2 ist , wird dies dieeuklidischeNorm genannt. Sie können den euklidischen Abstand alsx - y2 definieren . Wenn p = , bedeutet dies nurp

xp=(i=1d|xi|p)1/p
p=2xy2p=(odermaxixi). Genau genommen musspmindestens eins sein, damitxpeineNorm ist. Wenn0<p<1 ist, dann istxpnicht wirklich eine Norm, da Normen die Dreiecksungleichung erfüllen müssen.x=supiximaxixipxp0<p<1xp

(Es gibt auch -Normen, die analog definiert sind, mit Ausnahme von Funktionen anstelle von Vektoren oder Sequenzen - das ist wirklich dasselbe, da Vektoren Funktionen mit endlichen Domänen sind.)Lp

Mir ist keine Verwendung einer Norm in einer Anwendung für maschinelles Lernen bekannt, bei der , außer bei p = . Normalerweise sehen Sie p = 2 oder p = 1 oder manchmal 1 < p < 2, wo Sie den Fall p = 1 lockern möchten ; x1 ist in x nicht streng konvex , aber xp ist für 1 < p < p>2p=p=2p=11<p<2p=1x1xxp1<p<. Dies kann in bestimmten Fällen das "Finden" der Lösung "einfacher" machen.

Wenn Sie im Kontext der Regularisierung x hinzufügen zu Ihrer Zielfunktion, was Sie sagenistdass Sie erwartenx zuspärlich, das heißt,größten Teil aus Nullen besteht. Es ist ein bisschen technisch, aber wenn es einedichteLösung gibt, gibt es wahrscheinlich eine sparsamere Lösung mit derselben Norm. Wenn Sie erwarten, dass Ihre Lösung dicht ist, können SieIhrem Zielx2 2 hinzufügen , da es dann viel einfacher ist, mit der Ableitung zu arbeiten. Beide dienen dazu, zu verhindern, dass die Lösung zu viel Gewicht hat.x1xx22

Die gemischte Norm tritt auf, wenn Sie versuchen, mehrere Quellen zu integrieren. Grundsätzlich möchten Sie, dass der Lösungsvektor aus mehreren Teilen besteht , wobei j der Index einer Quelle ist. Die l p , q Norm ist nur die q -Norm alle p -Normen in einem Vektor gesammelt. Dh xp , q = ( m xjjp,qqp

xp,q=(j=1m(i=1d|xij|p)q/p)1/q

x1,212

Ich hoffe, das hilft.

Weitere Informationen finden Sie in diesem Dokument.

Josephine Moeller
quelle
1
+1 zur Erklärung gemischter Normen. Ich habe sie selbst nie verstanden.
Suresh Venkatasubramanian
(+1) Schöne Antwort. Willkommen bei CrossValidated, John!
MånsT