Dies tritt z. B. auf, wenn wir die ReLU-Aktivierungsfunktion in einem tiefen Netzwerk verwenden und über das CLT annehmen, dass die Eingaben in eine bestimmte Schicht ungefähr normal sind, dann ist dies die Verteilung der Ausgaben.
(Ich bin sicher, dass viele Leute dies bereits berechnet haben, aber ich konnte das aufgelistete Ergebnis nirgends auf eine einigermaßen lesbare Weise finden.)
Antworten:
Wir können dies zunächst so reduzieren, dass es nur von bestimmten Momenten univariater / bivariater abgeschnittener Normalverteilungen abhängt: Beachten Sie natürlich das
Wir werden einige Ergebnisse von verwenden
Rosenbaum betrachtet und berücksichtigt das Abschneiden auf das Ereignis . V ={ ˜ X ≥ a X , ˜ Y ≥ a Y }
Insbesondere werden wir die folgenden drei Ergebnisse verwenden, seine (1), (3) und (5). Definieren Sie zunächst Folgendes:
Nun zeigt Rosenbaum, dass:
Es ist nützlich, auch den Sonderfall von (1) und (3) mit , dh eine 1d-Kürzung: Pr ( V ) E [ ˜ X ∣ V ]einy= - ∞
Wir wollen nun
Wir werden sind die Werte von und wenn , .
Mit (*) erhalten wir nun und die Verwendung von (*) und (**) ergibt
Um , benötigen wirCov(X+,Y+)
Hier ist ein Python-Code, um die Momente zu berechnen:
und ein Monte-Carlo-Test, dass es funktioniert:
Dies gibt an10,000,000
0.000572145310512 0.00298692620286
, dass die behauptete Erwartung und Kovarianz mit den Monte-Carlo-Schätzungen übereinstimmen (basierend auf Stichproben).quelle