Welche Vor- und Nachteile haben verschiedene Datenformate (Leistung, Dateigröße usw.), wenn die Verteilung offener Daten in Betracht gezogen wird?
Unsere Organisation möchte Daten als offene Daten veröffentlichen. Es ist jedoch nicht klar, welche Datenformate verwendet werden sollen. Natürlich ist die Verwendung eines Datenformats umso einfacher, je offener es ist.
Welche Datenformate sind am 'offensten' und daher am besten für die Verteilung von Open Data geeignet, wenn folgende Typen berücksichtigt werden:
- Rasterdaten (ich denke: GeoTIFF, Erdas Imagine IMG?)
- Vektordaten (ich denke: GML, CSV, ESRI Shapefile, DXF?)
- Tabellarische Daten (ich denke: CSV?)
- 3D-Daten (ich denke: CityGML?)
- 3D point coulds / LIDAR (ich denke: LAS?)
- vergesse ich hier etwas?
Auch wenn es Dokumentation über offene Datenformate gibt, bin ich sehr interessiert, wenn Sie teilen möchten.
data
file-formats
Mark Verschuur
quelle
quelle
Antworten:
Die Open-Data-Initiative der Stadt Wien ( http://data.wien.gv.at ) nutzt Geoserver, um über Geoserver WMS- und WFS- Dienste auf Raster- und Vektor-Geodaten zuzugreifen . Dies hat viele Vorteile: Benutzer können Daten in verschiedenen Formaten für die Offline-Verwendung herunterladen (z. B. Geojson, KML oder gezippte Shapefiles) oder die Dienste live nutzen, indem sie sie in Online-Karten oder GIS-Projekte einbetten.
quelle
Für tabellarische CSV. Excel ist bestenfalls zu kompliziert und im schlimmsten Fall völlig unzugänglich. Der Zugang ist nicht zugänglich und PDF ist ein Schlag ins Gesicht.
Für die Verwendung in Geodaten ist Geojson ein Text, der gut unterstützt wird und nicht die technischen Einschränkungen aufweist, die das einzige andere brauchbare Format (Shapefile) aufweist. Es sei denn, Sie haben einen sehr guten Grund, es sollte in WGS84 sein, wobei zu berücksichtigen ist, dass sich die meisten Benutzer in einem anderen Zustand befinden und keine Zustandsebene wünschen.
quelle
Ich mag NetCDF für kontinuierliche / Array-Daten (dh Raster). Vorteile für NetCDF sind:
Der einzige Nachteil von NetCDF4, den ich sehe, ist die nicht sehr gute Unterstützung in Standard-GIS-Paketen wie ArcGIS und QGIS.
BEARBEITEN Einige andere Pakete, die NetCDF unterstützen
Einige Standard-Programmiersprachen, die NetCDF unterstützen (obwohl fairerweise alles, was HDF lesen kann, NetCDF4 lesen kann):
Für Mathe- und Statistikbenutzer haben Sie:
Speziell in GIS:
Wenn Sie sich schnell eine NetCDF-Datei ansehen möchten, würde ich das plattformübergreifende Panoply der NASA verwenden. Und wenn Sie an mehr interessiert sind, hat UCAR Unidata eine Liste von Software .
quelle
Ich würde sagen:
Diese Formate können von Open Source Software problemlos gelesen und in jedes andere für bestimmte Anwendungen erforderliche Format umgewandelt werden.
Auch +1 für das Öffnen von Daten!
quelle
Genau diese Frage stellte sich bei opendata.SE: In welchen Formaten lassen sich Geodaten am besten veröffentlichen?
Hoffentlich verstoße ich nicht gegen Richtlinien, wenn ich dort meine eigene Antwort zitiere:
Meine Erfahrung mit der Erstellung von Karten aus mehreren Regierungsdatensätzen:
Für Punktdaten ist CSV mit den Spalten "lat" und "lon" am besten geeignet. Es ist sehr einfach, mit einer Vielzahl von Werkzeugen zu arbeiten, einschließlich Texteditoren, Tabellenkalkulationen usw. Es gibt zwei Nachteile:
.vrt
Begleitdatei.lat
undlon
ist nicht ganz Standard. Viele Tools sind ziemlich liberal in dem, was sie akzeptieren.Für Linien und Polygone in absteigender Reihenfolge der Präferenz:
Ehrlich gesagt ist die beste Antwort wahrscheinlich "alle von ihnen". Tun Sie allen einen Gefallen und geben Sie die Daten in CSV (wenn vorhanden), GeoJSON, Zip-Shapefile und KMZ frei.
quelle