Ich schreibe derzeit einen Algorithmus für differenzielle Privatsphäre unter Verwendung des Laplace-Mechanismus.
Leider habe ich keinen statistischen Hintergrund, daher sind mir viele Begriffe unbekannt. Jetzt stolpere ich über den Begriff: Laplace-Lärm . Um ein Dataset-Differential privat zu machen, sprechen alle Papiere nur über das Hinzufügen von Laplace-Rauschen gemäß der Laplace-Verteilung zu den Funktionswerten.
(k ist der private Differenzwert, f der von der Bewertungsfunktion zurückgegebene Wert und Y das Laplace-Rauschen)
Bedeutet dies, dass ich Zufallsvariablen aus der Laplace-Verteilung gemäß dieser Funktion aus Wikipedia https://en.wikipedia.org/wiki/Laplace_distribution erstelle ?
UPDATE: Ich habe bis zu 100 Zufallsvariablen aus der obigen Funktion gezeichnet, aber dies gibt mir keine Laplace-Verteilung (nicht einmal in der Nähe). Aber ich denke, es sollte eine Laplace-Distribution modellieren.
UPDATE2:
Das sind die Definitionen, die ich habe:
(Der Laplace-Mechanismus). Bei jeder Funktion ist der Laplace-Mechanismus definiert als: wobei Y iid Zufallsvariablen sind, die aus
Ebenso gut wie:
Um Y (X) zu erzeugen, wird häufig eine Laplace-Verteilung mit dem Mittelwert Null und dem Skalenparameter Δ (f) / ε verwendet
Antworten:
Sie haben Recht. Wenn Sie Laplace-Rauschen hinzufügen, bedeutet dies, dass Sie Ihrer Variablen die Variable hinzufügen , die der Laplace-Verteilung folgt . Es gibt mehrere Gründe, warum es als Rauschen bezeichnet wird . Stellen Sie sich zunächst die Signalverarbeitung vor, bei der die Nachricht über einen Kanal gesendet wird und das empfangene Signal aufgrund der Unvollkommenheit des Kanals verrauscht ist. Sie müssen also das Signal vom Rauschen isolieren. Zweitens sprechen wir in der Kryptographie auch über pseudozufälliges Rauschen, und die unterschiedliche Privatsphäre hängt mit der Kryptographie zusammen. Drittens können wir in Statistik und maschinellem Lernen auch über statistisches Rauschen sprechen . Statistische Modelle enthalten Rauschen oder Fehlerbegriffe usw. (es gibt sogar ein Buch über die Vorhersage von NamenX. Y. Signal und Rauschen von Nate Silver). Deshalb verwenden wir Rauschen als genaueres Synonym für mehrdeutige Zufälligkeit .
In Bezug auf die Zufallsgenerierung gibt es eine Reihe von Möglichkeiten, wie Sie nach der Laplace-Verteilung Zufallswerte zeichnen können, zum Beispiel:
In den folgenden Darstellungen sehen Sie die Verteilung von Proben, die mit jeder der Funktionen mit der zugehörigen Laplace-Dichte (rote Linie) gezogen wurden.105
Um die Beispiele zu vereinfachen, verwende ich die Standard-Laplace-Verteilung mit scale = 1, aber Sie können die Ergebnisse leicht ändern, indem Sie die Ergebnisse mit verschiedenen Skalierungsfaktoren multiplizieren.
quelle
Die Laplace- oder doppelte Exponentialverteilung fällt um einen Mittelwert exponentiell nach links und rechts ab. Es ist im Grunde das Exponential, das auf die andere Seite gespiegelt wird.
Wenn Sie die Wahrscheinlichkeit möchten, verwenden Sie die Wahrscheinlichkeit des Exponentials und fügen Sie dem beobachteten Wert ein abs () hinzu. Die logarithmische Wahrscheinlichkeit ist einfach die abs () der Residuen, multipliziert mit der Rate des Exponentials.
Zum Abtasten ist es am einfachsten, aus -1,1 zu zeichnen und mit einem Zug aus der Exponentialverteilung zu multiplizieren, die in den meisten Programmiersprachen verfügbar ist. Wie oben erwähnt, finden Sie alternativ auch direkte Implementierungen des Laplace, für die jedoch möglicherweise etwas mehr Suche erforderlich ist.
quelle