Was bedeutet

10

Was bedeutet ?einp=(ich=1n|einich(t)|p)1p

Diese Formel wird auf der fünften Seite einer Zusammenfassung des verbesserten Datenstroms beschrieben: Die Count-Min-Skizze und ihre Anwendungen ( hier zu finden ). Ich implementiere die Count-Min-Skizze und kann die Grundkonzepte gut verstehen, aber einige der Feinheiten werden anhand dieser Gleichung und einer anderen Terminologie erklärt, mit der ich nicht vertraut bin.

Kaelin Colclasure
quelle

Antworten:

11

Es ist die -Norm. Siehe zum Beispiel die Wikipedia-Artikel:Lp

Wenn Sie , werden Sie feststellen, dass es sich um die bekanntere euklidische Norm handelt - dh um das bekannteste Maß, das als Länge des Vektors a verwendet wird . Andere Werte von p geben andere Möglichkeiten zur Längenmessung an, wie im Artikel beschrieben - siehe Abschnitte zur euklidischen Norm, Taxicab-Norm usw.p=2ein

ars
quelle
Gibt es ein zugängliches Lehrbuch, in dem erläutert wird, wie und warum Manhattan Distances in der Statistik nützlich sind?
Kaelin Colclasure
1
@Kaelin: Leider fällt mir kein Text ein, der dies speziell behandelt. Ich kann Ihnen sagen, dass der L1-Abstand bevorzugt wird, da er weniger empfindlich für Ausreißer ist. Es hängt auch mit Abständen zwischen empirischen Verteilungen in der Wahrscheinlichkeitstheorie zusammen (L1 ist doppelt so groß wie der "Gesamtabweichungsabstand": en.wikipedia.org/wiki/Total_variation_distance ).
Ars
Sie können sehen , hier eine intuitive Erklärung, warum die Manhattan - Distanz oder L1 - Norm, über andere Distanzen bevorzugt. Es kommt alles auf den "Fluch der Dimensionalität" an. Genauer gesagt ist der Lebesgue-Raum integrierbarer Funktionen, während l n der Vektorraum für Vektoren ist, die beliebig viele Komponenten enthalten. Grundsätzlich, wenn Sie über Summen von Funktionen sprechen, reden Sie l n und, wenn Sie Funktionen sind zu integrieren, es ist L n . L.nlnlnL.n
Douglas De Rizzo Meneghetti
6

In diesem Artikel werden -Normen anscheinend nicht wesentlich verwendet - jedes der Ergebnisse verweist explizit auf die L 1 -Norm. Das Problem selbst bestimmt, welche Norm verwendet werden soll. In diesem Fall konzentriert sich das Interesse auf die Kardinalität von Multisets. Ein Multiset wird als ein Vektor der Zählungen seiner Elemente dargestellt, von wo aus seine Kardinalität zufällig mit seiner L 1 -Norm übereinstimmt. Oft können Ergebnisse, die für eine Norm bewiesen wurden, ohne Änderung des Beweises für einen weiten Bereich von p (typischerweise 1 p ) gelten. Die Möglichkeit einer größeren Allgemeinheit ohne Kosten wird viele Artikel wie diesen dazu veranlassen, über L p zu sprechenL.pL.1L.1p1pL.p Normen.

-Normen kommen in Diskussionen über die Dualität in der Hilbert- und Banach-Raumtheorie zur Geltung. Fortgeschrittene, aber einführende (es ist kein Widerspruch!)Bücher über Analysenbehandeln dieses Material normalerweise gründlich. Eine Einführung in einige der Beziehungen zwischen diesen Normen finden Sie über dieUngleichheitderInhaberund dieUngleichungderMinkowski.L.p

whuber
quelle
+1. Obwohl ich nicht sicher bin, ob ein Analysebuch, auch wenn es Rudin ist, "zugänglich" ist. ;-)
ars
@ars: Ja, aber ich kenne niemanden, der es wirklich ist. Deshalb habe ich auf die beiden Wikipedia-Artikel hingewiesen.
whuber
Ich weiß, es hat mir gefallen - es ist die richtige Empfehlung für den Fall, dass das OP tiefer graben möchte.
Ars
2

bezeichnet eine bestimmte Funktion, die alsNormbezeichnet wird und in einem Vektorraum definiert ist. Es bildet ein n- dimensionales Element eines Vektorraums in eine nicht negative reelle Zahl ab. | | a | | p bezeichnet eine noch bestimmte Norm, die im Vektorraum definiert ist. Sei V ein Vektorraum. Jede Funktion p : V R + , auch mit p ( v ) | bezeichnet | v | | so dass||ein||n||ein||pV.p::V.R.+p(v)||v||

  1. ist endlich und konvexp
  2. p(x)=0x=0
  3. αR.,xV.,p(αx)=|α|p(x)

wird in als Norm bezeichnet und ( V , p ) ( V , | || | wird dann als normierter Raum bezeichnet. Sie können überprüfen, ob Ihre Funktion alle diese Eigenschaften erfüllt. In Ihrem Beispiel ist V auch ein Raum von Funktionen, das ist ein i : T T 'V.(V.,p)(V.,||||V.einich::T.T.'. Dies ist eine Verallgemeinerung des euklidischen Raums (mit der euklidischen Norm), mit der Sie möglicherweise vertraut sind. Dies ist nur ein besonderer Fall des normierten Raums, bei dem die zugrunde liegende Menge die (n-dimensionalen) reellen Zahlen und die Norm die sogenannte euklidische Norm ist , ein besonderer Fall der Funktion, die in Ihrer Frage erscheint.

Zum Beispiel ist die euklidische Ebene ein normierter Raum, so dass , x = ( x 1 , x 2 ) R 2 , und definieren Sie die Norm auf R 2 als p ( x ) = | | x | | 2 = | | x | | = V.=R.2x=(x1,x2)R.2R.2. Es ist also nur eine Ebene und die Norm gibt die "Größe" des Vektors an. Beachten Sie, dass dies nur ein Sonderfall der von Ihnen erwähnten Norm ist, so dassn=2,p=2,ai(x)=xi, und Sie den Absolutwertoperator nicht benötigen, da es sich um eine Summe quadratischer Terme handelt .p(x)=||x||2=||x||=(x1+x2)2=(ich=12xich2)1/.2n=2,p=2,einich(x)=xich

Diese Themen werden entweder in Lehrbüchern zur Realanalyse oder zur linearen Algebra (in eingeschränkter Weise) unter der Rubrik Normen oder normierte Räume behandelt.

Diogo
quelle