GIS-bezogene Informationen Governance [geschlossen]

22

Ich arbeite oft daran, sensible Daten auf Patientenebene abzubilden. Ich habe zwar das Gefühl, einen guten Überblick über viele der damit verbundenen Governance-Probleme zu haben (z. B. wann man Binning- und K-Anonymitätstechniken einsetzt), möchte aber mein Wissen dazu verbessern.

Hier ist ein gutes Beispiel dafür, warum dies von Bedeutung ist: Räumliche Vertraulichkeit und GIS: Umgestaltung der Sterblichkeitsorte anhand veröffentlichter Karten über den Hurrikan Katrina

Hat jemand gute Faustregeln für die Zuordnung sensibler Daten?

Gibt es gute Ressourcen, die verschiedene Methoden zum Schutz der Vertraulichkeit abdecken oder Anleitungen zu diesem Thema geben?

Stürzen
quelle
2
+1 (Übrigens wird eine in einem vorherigen Thread vorgeschlagene Methode zur Datenanonymisierung unter gis.stackexchange.com/questions/31236/… angezeigt. ) Können Sie klarstellen, was Sie mit "Faustregeln" meinen? Suchen Sie nach technischen Lösungen zum Verbergen von Datendetails oder suchen Sie nach Anleitungen, wann und in welchem ​​Umfang Daten geschützt werden sollen?
whuber
1
In erster Linie technische Lösungen, aber auch Hinweise zum Schutzniveau wären hilfreich. Ich sehe das als Hand in Hand. Beispielsweise sollten sehr vertrauliche Daten, die aus vielen kleinen Zahlen bestehen, mithilfe von Technik X oder Technik Y angezeigt werden, wenn demografische Informationen enthalten sind. Ich überlegte, Hex-Binning für eine Aufgabe zu verwenden, aber plötzlich hatte ich keine Ahnung von der Population in jedem Hexagon. Was ist, wenn ich einen Wert von 20 anzeigte und dann feststellte, dass sich in diesem Sechseck nur 20 Einwohner befanden? Ich habe auch kürzlich über das Problem der modifizierbaren Antenneneinheit in diesem Zusammenhang gehört.
Tumbledown
Ich habe dafür gestimmt, dass dies zu weit gefasst ist, da sowohl eine Liste mit "Faustregeln" als auch eine Liste mit Ressourcen gesucht wird.
PolyGeo

Antworten:

8

Diese Diskussion wird im GIS-Beruf dringend benötigt, und ich gebe der Hochschulbildung die Schuld, dieses Thema vernachlässigt zu haben.

Das heißt, hier ist einige interessante, wenn nicht veraltete Literatur zu diesem Thema. Der einzige wirkliche Konsens zwischen diesen Ressourcen besteht darin, dass es im GIS-Beruf keinen Konsens in Bezug auf die Privatsphäre gibt, dies sollte jedoch ein Hauptanliegen sein.

Ethik von GIS | Jeremy Crampton

Schutz der Privatsphäre bei der Nutzung von Geoinformationssystemen | Harlan J. Onsrud, Jeff P. Johnson und Xavier Lopez | LINK AKTUALISIERT 1.11.17

Datenschutz und Vertraulichkeit im Gesundheitswesen GIS | LINK AKTUALISIERT 1.11.17

Sean Adkins
quelle
1
Ich habe dies so gewählt, dass es die Schwierigkeit unterstreicht, die (noch) in diesem Bereich liegt. Pickles hat wirklich (und mit Absicht) eine so massive Dose Würmer mit seinen Beobachtungen geöffnet, dass es fast unmöglich ist, jeden möglichen Akt der Geheimhaltung anzugehen. Es gibt immer das heikle Problem des Kontextwissens, das einen Anspruch auf Offenlegung beeinflusst, sowie des angewandten Wissens von außerhalb der ursprünglichen Ressource, das zur Identifizierung einer Person verwendet werden kann. Durch Hashing von Daten oder räumlich versetzten Punkten können solche potenziellen Probleme niemals beseitigt werden. Also hast du so ziemlich deine eigene ethische Haltung!
Andrew Tice
Standard-Anonymitätsverfahren neigen dazu, Annahmen über normalverteilte Populationen zu treffen, wenn die meisten räumlichen Analysen dazu tendieren, weit von der Normalverteilung entfernt zu sein. Die Erstellung von Rastern trägt ein wenig dazu bei, die wahrgenommene Genauigkeit von Ausgaben zu verwischen, und kann daher für die allgemeine Darstellung in Betracht gezogen werden. Die ursprüngliche Frage erwähnte die MAUP, und sicherlich könnte die Verwendung einer Form von SCAM auf verschiedenen räumlichen Ebenen hilfreich sein, obwohl es sich am Ende lohnen könnte, so etwas wie Openshaws GAM abzuwischen?
Andrew Tice
1
@ AndrewTice Kann ich fragen, was Betrug ist? Meine Fähigkeit, Akronyme zu entfernen, hat mich heute verlassen!
Tumbledown
1
@Tumbledown - Entschuldigung! Es steht für Small Cell Adjustment Method. Wenn Sie das vollständig googeln, finden Sie Literatur von ONS in Großbritannien. Es ist eine der bewährten Methoden für die Erstellung von Berichten für kleine Volkszählungen und wird daher für die Zählung von Flächeneinheiten angewendet. Es ist ein bisschen brachial, aber da das ONS es weit verbreitet hat, gibt es ein wenig Rechtfertigung für die Anwendung der Methode.
Andrew Tice
1
Huch! Immer ein Mist, wenn auf älteres Material verwiesen wird. Ich werde versuchen, funktionierende Links zu finden und meinen Beitrag entsprechend zu bearbeiten. Vielen Dank!
Sean Adkins
4

Dies sind die Regeln, die Eurostat für die Meldung von Standorten von Betrieben festlegt. Standorte werden mit gerundeten Koordinaten und in bestimmten Fällen durch Anwenden eines zusätzlichen halbzufälligen Versatzes gemeldet. Ich weiß nicht, ob sie eine gute Faustregel geben, aber zumindest werden diese Regeln von einer bekannten europäischen Behörde angewendet.

Bezüglich des Standorts des Betriebs gelten zwei Grundsätze: (i) Es sind keine genauen Koordinaten erforderlich. und (ii) ein Standort mit nur einem Bestand wird neu codiert.

(i) Es sind keine genauen Koordinaten erforderlich: Die Längen- und Breitengradkoordinaten werden nicht in Sekunden oder Dezimalbruchteilen von Minuten angegeben. Der Standort muss nur bis zu 5 Minuten angegeben werden. Dies entspricht einer Landfläche von ca. 3.000 bis 7.000 ha, je nach Standort in Europa.

ii) ein Standort mit nur einem Betrieb wird neu codiert: In Gebieten mit sehr großen Betrieben kann der auf 5 Minuten geografische Länge und Breite genau festgelegte Standort nur einen Betrieb enthalten, der daher direkt identifizierbar wäre. Um sicherzustellen, dass eine direkte Identifizierung nicht möglich ist, sollte der Standort mit nur einem Betrieb dem nächstgelegenen (zufällig ausgewählten) Nachbarpunkt mit mindestens einem anderen Betrieb zugeordnet werden. Wenn einer der 8 Nachbarstandorte nicht über mindestens eine Beteiligung verfügt, müssen die Nachbarstandorte verlängert werden, bis sich andere mit mindestens einer anderen Beteiligung befinden. Der landwirtschaftliche Betrieb sollte jedoch nach Möglichkeit der NUTS-3-Region zugeordnet werden, in der er sich befindet.

user30184
quelle
1

Ich dachte, ich würde diese nützliche Seite als zusätzlichen Link einfügen : UK Anonymisation Network

Es ist nicht GIS-spezifisch und richtet sich an Großbritannien. Es enthält jedoch einige nützliche Informationen und Ressourcen zur Verringerung des Offenlegungsrisikos.

Sie führen auch eine Reihe von kostenlosen Anonymisierungsworkshops und -kliniken durch

Stürzen
quelle
Ein weiterer nützlicher Link, ein Entscheidungsrahmen von UKAN: ukanon.net/ukan-resources/ukan-decision-making-framework
Tumbledown