Was ist eine gute Taxonomie oder Namenskonvention für Dateien und Ordner, die GIS-Daten enthalten? [geschlossen]

13

In meinem Unternehmen wurden in den letzten 8 Jahren etwa 30 TB GIS-Daten gesammelt. Dabei stelle ich mir immer die folgenden Fragen:

  1. Welche Art von Daten haben wir für ein bestimmtes geografisches Gebiet?
  2. Was sind die Details zu diesen Daten (z. B. Auflösung in Metern pro Pixel)?
  3. Wo sind die Daten auf der Festplatte vorhanden, damit ich sie tatsächlich verwenden kann?
  4. Haben wir die Daten bereits verarbeitet oder sind sie unverändert aus der Quelle?

Bis jetzt habe ich versucht, diese Fragen zu beantworten, indem ich eine geeignete Ordner- und Datei-Taxonomie / -Hierarchie entwarf. Hat jemand Ideen / Vorschläge zu verständlichen, vielleicht sogar standardmäßigen Methoden zum Organisieren von GIS-Daten mithilfe von Dateien und Ordnern?

Ich bin auch offen dafür, mehr darüber zu erfahren, wie die Verwendung einer Datenbank meinem Unternehmen zugute kommen kann. Wir sind Softwareentwickler und keine GIS-Experten. Ich vermute, wir sind ein gutes Stück hinter der Frage zurückgeblieben, wie das Problem der Speicherung / Organisation von GIS-Daten zur Vereinfachung der Verwendung am besten gelöst werden kann. Ich habe die Frage Best Practices für das Verwalten von Geodaten gesehen, konnte jedoch nur eine marginale Verwendung aus den Antworten ziehen, da ich mit Geodatabases so wenig vertraut bin.

UPDATE: Letzte Woche habe ich ein bisschen über GIS-Datenbanken gelesen und mich mit PostGIS vertraut gemacht. Langfristig werden wir voraussichtlich einen Datenbank- und Metadatenserver einsetzen, wie dies von JasonBirch in den Best Practices für die Verwaltung von Geodaten empfohlen wird .

Sipp
quelle
7
Schauen Sie sich diese Frage an: gis.stackexchange.com/questions/2976/…
Derek Swingley
Danke, diese Frage ist definitiv verwandt und bietet einige gute Hintergrundinformationen.
Sipp

Antworten:

2

Wenn Sie tatsächlich versuchen, Daten zu bearbeiten oder eine Karte zu entwickeln, müssen Sie die Daten, an denen Sie aktiv arbeiten, von den Daten, mit denen Sie begonnen haben, trennen. Wenn ich ein Projekt starte, erstelle ich einen SourceData-Ordner mit Unterverzeichnissen, die nach dem Datentyp (DEM, Orthophoto, Hydrologie usw.) benannt sind. Dieser Ordner enthält alle Ebenen, die ich lediglich als Referenz verwende. Alle Daten, an denen ich arbeite, werden in einen anderen Ordner namens Working kopiert . Der Arbeitsordner enthält Daten, MXDs und alles andere, was ich in Unterverzeichnissen ändere oder erstelle, die normalerweise mit einer Phase des Projekts korrelieren (MXDs, RoadEdits, Delivery usw.).

Zusätzlich zu den eigentlichen GIS-Daten sollten Sie einen Kommunikations- oder Spezifikationsordner erstellen, in dem alle Dokumente Ihres Kunden / internen Kunden / Professors gespeichert sind. Dies kann als Metadaten dienen, wenn Sie zu einem späteren Zeitpunkt zum Projekt zurückkehren, sowie als zentraler Ort, an dem jeder andere sehen kann, was geschehen soll.

jvangeld
quelle
1
Gute Argumente; Unser Unternehmen erstellt Karten, die von unserer Software verwendet werden, und wir haben bereits ein Ordnerschema entwickelt, um "Rohdaten" von "Arbeitsdaten" von "finalisierten" Daten zu trennen. Eines der Probleme besteht darin, herauszufinden, welche Rohdaten als ursprüngliche Grundlage für eine endgültige Karte verwendet wurden. Ihr Vorschlag für einen "Specifications" -Ordner scheint das anzugehen. Für jede Karte, die wir erstellen, müssen Sie angeben, welche Rohdatenquelle bei der Erstellung der Karte verwendet wurde (was wir derzeit nicht tun). Danke für die Tipps!
Sipp
1

Es scheint mir, dass Sie eine Reihe von Metadaten benötigen, um diese Informationen zu speichern, und ein Abrufsystem, das die Metadaten verwendet, damit Sie Daten auf der Grundlage der Informationen extrahieren können.

Ich denke, Sie möchten eine Lösung, die einen OGC-Katalogdienst unterstützt, für maximale Interoperabilität. Ich habe gesehen, wie Kollegen Deegree verwendet haben - obwohl es natürlich auch andere Lösungen gibt, die Sie ausprobieren sollten.

Hier ist ein Beispiel, wie wir Deegree in unsere Software eingebunden haben (die Live-Demo ist zur Zeit wegen Wartungsarbeiten inaktiv - wisst ihr nicht! - sollte aber nächste Woche wieder verfügbar sein).

Bei der Benennung von Dateien ist es weniger problematisch, wie und wo die Dateien benannt werden, wenn Sie über einen Katalogservice und einen Übermittlungsmechanismus verfügen. Ansonsten denke ich, es kommt darauf an, wie Sie nach den Daten suchen. Grenzen Sie zunächst das geografische Gebiet oder den Datentyp ein? Hierdurch wird bestimmt, ob die Hierarchie mit der Aufteilung der Daten in Kacheln und anschließend mit den Datentypen pro Kacheln beginnt. oder indem Sie es in Datentypen aufteilen, von denen jeder eine Reihe von Kacheln hat.

Natürlich haben Sie bei einer räumlichen Datenbank nicht die gleichen Probleme mit der Aufteilung der Daten in Kacheln, sodass dies häufig eine bevorzugte Methode ist - vorausgesetzt, die Endanwendung unterstützt die Verwendung dieses Datentyps.

Markieren Sie Irland
quelle
Danke für die Vorschläge Mark. Anscheinend schlagen Sie vor, dass hier einige Komponenten im Spiel sind: die Metadaten selbst (z. B. eine XML-Datei), ein Abrufsystem (Deegree?), Das weiß, wie Daten basierend auf bestimmten Metadatenanforderungen des Benutzers gefunden werden, und a Speicher-Backend-Komponente (z. B. PostGIS?), die sowohl Daten als auch Metadaten speichert. Ist das genau
Sipp
1

ich würde wählen SpatiaLite , eine Datenbank mit einer Datei, in die Sie alle Ihre Shapefiles, Raster und Tabellen einfügen können. Als relationale SQL-Datenbank stehen Ihnen dann SQL-Abfragen zur Verfügung, mit denen Sie alle erforderlichen Aktionen (Verbinden, Auswählen, Zusammenführen, Vereinigen, Teilen usw.) zwischen Attributen und Dateien ausführen können.

SpatiaLite kann für einen höheren Automatisierungsgrad auch in Programmiersprachen wie Python aufgerufen werden. Der Himmel ist die Grenze.

SpatiaLite Dokumentation und Tutorials

dimitris
quelle
0

Ich finde es nützlich, Word-Dokumente mit dem Titel "Name oder Thema der Karte - Metadaten comments.doc" zu erstellen. Dokumentieren Sie wichtige Änderungen und Arbeitsabläufe in chronologischer Reihenfolge (JJJJ-MM-TT) für jedes Karten- und / oder Datensatzthema. Wenn Sie den Verlauf eines Datensatzes ermitteln müssen: i) Geben Sie das Änderungs- / Erstellungsdatum der zugehörigen Dateien an, die als historische Referenzen oder potenzielle Quelldateien nützlich sind. Fügen Sie eine kurze Zusammenfassung des Inhalts jeder Datei (Ebenennamen, Anzahl der Datensätze) bei, und achten Sie dabei auf allgemeine Ähnlichkeiten oder Unterschiede (dh was ist neu in jeder Version einer Karte oder eines Datensatzes). Behalten Sie die Datei "- Metadaten-Kommentare" im selben Arbeitsordner wie die neueste Version der Karte oder des Datensatzes. Platzieren Sie ältere Versionen der Karte oder der Daten in einem Archiv-Unterordner. Der dreistufige Prozess funktioniert gut für die Softwareentwicklung, Datenbankentwicklung und Dateiverwaltung: 1) Entwickeln (& Dokumentieren); 2) Test (& Dokument); 3) Veröffentlichen (einschließlich Metadaten). 1) Arbeitsordner; 2) Unterordner archivieren; 3) Veröffentlichte Version.

Pascal Cyr
quelle