Soweit ich das beurteilen kann, handelt es sich im Wesentlichen um eine Frage der mathematischen und nicht der statistischen Terminologie.
Auf jeden Fall ist der Punkt, dass die Statistiken keine differenzierbare Funktion der Stichprobe oder keine n− mal kontinuierlich differenzierbare Funktion der Stichprobe sind.
Mit anderen Worten, es gibt möglicherweise Stellen, an denen die Reaktion der Statistik auf Änderungen in der Stichprobe nicht ideal oder unattraktiv abrupt ist (daher die Terminologie "glatt"), so dass beispielsweise lineare oder polynomielle Funktionen der Daten funktionieren, z. könnte nie haben.
Die Wikipedia-Seite über reibungslose Funktionen ist an einigen Stellen wahrscheinlich unnötig technisch, aber hoffentlich können einige der Bilder und die ausführliche Diskussion Ihnen eine Vorstellung davon geben, was unter dem Begriff "Glätte" hervorgerufen werden soll.
Wenn eine bestimmte Funktion eine "differenzierbare Funktion von Abtastmomenten" ist, kann sie eine glatte Funktion der Abtastmomente sein, abhängig davon, in welchem Sinne "glatt" in diesem Kontext verwendet wird. Ich sehe meistens "glatt", was unendlich oft kontinuierlich differenzierbar bedeutet (z. B. wie Polynome oder lineare Funktionen oder Sinus und Cosinus), aber manchmal kann der Begriff in einem weniger strengen Sinne verwendet werden, wie auf der Wikipedia-Seite erwähnt.
Auf jeden Fall haben Sie definitiv Recht, dass es um Differenzierbarkeit geht - das ist die Schlüsselidee.
Es ist auch erwähnenswert, dass es Funktionen gibt, die kontinuierlich, aber nicht "glatt" sind - die Idee ist, dass Kontinuität zwar im Allgemeinen eine nette Regelmäßigkeitseigenschaft ist, in vielen Fällen jedoch immer noch viele unerwünschte pathologische Verhaltensweisen zulässt, während solche pathologischen Verhaltensweisen dies nicht können treten für glatte Funktionen auf, weil sie noch schöner sind als kontinuierliche.
Beispiel: Betrachten Sie zum Beispiel den LASSO-Schätzer mit orthonormalen Kovariaten:
β^j=SNλ(β^OLSj)=β^OLSjmax⎧⎩⎨⎪⎪⎪⎪0,1−Nλ∣∣β^OLSj∣∣⎫⎭⎬⎪⎪⎪⎪,
wobei .β^OLS=(XTX)−1XTy=XTy
Zuerst stellen wir fest, dass in den Koordinaten von und linear ist, da in und linear ist , vorausgesetzt (unter der Annahme, dass oder stellt das Beispiel dar.) Alle sind vollständig glatte Funktionen und nicht die Ursache für die Nichtglätte. Stattdessen kommt jede Nichtglätte von der maximalen Funktion die in der Definition von , wie ich Sie weiter unten überzeugen werde.β^OLSjXyβ^OLSXyXyβ^OLSjmaxβ^j
Wir verwenden die Identität (diskutiert und bewährte hier ) den obigen Ausdruck zu umschreiben wie folgt:max{x,y}=x+y+|x−y|2
β^j==β^OLSj2⎡⎣⎢⎢−⎛⎝⎜⎜Nλ∣∣β^OLSj∣∣−1⎞⎠⎟⎟+∣∣∣∣∣Nλ∣∣β^OLSj∣∣−1∣∣∣∣∣⎤⎦⎥⎥⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪0,β^OLSj⎛⎝⎜⎜1−Nλ∣∣β^OLSj∣∣⎞⎠⎟⎟,when Nλ∣∣β^OLS∣∣≥1when Nλ∣∣β^OLS∣∣≤1
In dieser Form ist es offensichtlich, dass wir mindestens zwei mögliche Quellen für nicht glattes Verhalten haben: (1) wenn , wodurch ein Nenner verschwindet, (2) und mögliche Höcker an den Punkten, an denen: da an diesen Punkten natürlich das "Zusammenkleben" zweier verschiedener Funktionen welche, obwohl sie an den Punkten, an denen den gleichen Wert haben β^OLSj=0
Nλ∣∣β^OLSj∣∣=1⟺Nλ=∣∣β^OLSj∣∣,
β^j(0 and β^OLSj(1−Nλ∣∣∣β^OLSj∣∣∣))Nλ=∣∣β^OLSj∣∣müssen nicht unbedingt so "gut zusammenspielen", dass die Ableitungen für die linke und die rechte Hand für alle übereinstimmen . Das grundlegendste Beispiel für eine Funktion, für die dies nicht der Fall ist, istbeim Wert : Die erste Ableitung für die linke Hand ist und die erste Ableitung für die rechte Hand ist , daher ist sie bei nicht glatt . Ich vermute, dass ein analoges Phänomen wahrscheinlich für die Funktion an den Punkten an denen dazu , dass keine reibungslose Funktion seiner Eingaben ist.
n|x|x=0−11x=0β^jNλ=∣∣β^OLSj∣∣β^j
Die Funktion nur in Bezug auf ihre Eingabeargumente glatt sein, um als glatt betrachtet zu werden. Vermutlich sind seine Eingabeargumente das Sample selbst oder einige Funktionen des Sample. Wenn eine Funktion der Funktionen des Samples ist, kann man durch Komposition eine neue Funktion , die überspringt der Mittelsmann (dh er gibt die gleichen interessierenden Ergebnisse zurück und ist direkt eine Funktion der Stichprobe). Nach der Kettenregel ist diese zusammengesetzte Funktion genau dann glatt, wenn beide Funktionen undβ^jgβ^jgβ^j∘gβ^~jβ^~j=β^j∘gβ^jg sind glatt.