Verwenden von Dropbox zum Synchronisieren von Datei-GeoDatabases?

11

Ich konnte ein großes kostenloses Dropbox-Konto aufbauen und damit meine GIS-Datenbanken auf mehreren verschiedenen PCs synchronisieren. Ich habe gerade damit begonnen und hatte bisher keine Probleme. Aber ich bekomme ein paar rote Warnflaggen, die mir Angst machen.

Es scheint mehrere doppelte Dateien in den GeoDatabases zu geben. Normalerweise so etwas wie:

a00000017.gdbtable (GIS-HP-Kopie)

Ich kann diese Dateien problemlos manuell löschen, habe aber keine Ahnung, warum sie auftauchen.

Anstatt Dateisperren zu entfernen, sagt Dropbox immer wieder, dass sie umbenannt werden. Wenn ich also eine Sperre aufhebe und eine andere erhalte, wird die Datei umbenannt, anstatt sie zu löschen und eine neue zu erstellen. Obwohl die Sperrdatei immer noch gelöscht wird, wenn ich mich vollständig von der GeoDatabase getrennt habe.

Wie gesagt, ich hatte bisher keine Probleme, aber ich mache mir Sorgen über die langfristige Beschädigung von Daten bei der Verwendung von Dropbox.

Hat jemand Dropbox verwendet und Probleme bei der Synchronisierung von GIS-Daten festgestellt?

Cody Brown
quelle
3
Ich habe keine endgültige Antwort, aber ich würde vorschlagen, dass Sie vorsichtig sein sollten. Ich glaube nicht, dass DropBox für den Zugriff auf ein komplexes Datenformat wie eine Datei-Geodatabase gedacht ist, die aus mehreren diskreten Dateien auf mehreren PCs gleichzeitig besteht. Dieser Beitrag zeigt einige potenzielle Probleme zu beachten
Stephen Lead
@StephenLead Ich habe die Dropbox-Daten täglich gesichert. Ich habe Amazon Cloud Drive ungefähr ein Jahr lang ohne Probleme verwendet, aber das ist für die Synchronisierung so langsam. Dropbox funktioniert viel schneller und einfacher. Ich hoffe wirklich, dass es damit umgehen kann.
Cody Brown
2
Es ist besser, die Datei-Geodatabase zu komprimieren, bevor sie zum Freigeben von resources.arcgis.com/en/help/main/10.2/index.html#//… verwendet wird. Sie kann nicht mit mehr als einem Benutzer gleichzeitig bearbeitet werden - lck-Dateien sollten dies verhindern.
Mapperz
Solide Idee @Mapperz
Cody Brown

Antworten:

9

ESRI hat die FileGDB-Dateistruktur absichtlich verschleiert, damit die Leute nicht versuchen, intern damit herumzuspielen:

Eine Datei-Geodatabase wird als Ordner mit Dateien gespeichert. Wenn Sie den Ordner mit Windows Explorer anzeigen, sieht er abgesehen von der Erweiterung .gdb wie jeder andere Ordner aus und Sie können dessen Inhalt anzeigen. Der Ordner enthält kryptisch benannte Dateien, die geografische Daten, Attributdaten, Indexdateien, Sperrdateien und eine Signaturdatei sowie andere Dateien enthalten. Jede Feature-Class oder Tabelle in der Geodatabase wird in zwei oder mehr Dateien gespeichert. Aufgrund des Designs ist es schwierig, wenn nicht unmöglich, festzustellen, aus welchen Dateien ein bestimmter Datensatz besteht.

ESRI empfiehlt, dass Sie FileGDBs mit ihren Tools und nicht mit Ihren Betriebssystem-Tools kopieren. Es ist jedoch möglich, die gesamte Datenbank zu kopieren oder umzubenennen:

Obwohl dies nicht empfohlen wird, können Sie eine Datei-Geodatabase an einen anderen Speicherort kopieren, indem Sie den Ordner an einen anderen Speicherort kopieren (wenn Sie ein Windows Vista-Betriebssystem verwenden, müssen Sie auch die Erweiterung des neuen Ordners in .gdb ändern, andernfalls ArcGIS kann es nicht als Datei-Geodatabase erkennen. Kopieren Sie eine Datei-Geodatabase nur mit Windows Explorer, wenn Sie sicher sind, dass keine anderen Prozesse auf die Daten zugreifen. Das Problem ist, dass es schwierig sein kann zu sagen, ob andere Prozesse auf die Daten zugreifen. Sie könnten denken, es gibt keine anderen Prozesse; Ein Prozess auf Ihrem oder einem anderen Computer kann jedoch darauf zugreifen. Wenn Sie den Ordner kopieren, während ein anderer Prozess auf die Daten zugreift, werden die Daten möglicherweise nicht ordnungsgemäß kopiert.

Ich wäre vorsichtig, wenn ich Dropbox verwenden würde, um die Dateien einzeln zu synchronisieren. Die Datenbankstruktur ist einfach nicht dafür ausgelegt, auf diese Weise manipuliert zu werden. Wenn Ihr Dataset klein genug ist, ist es möglicherweise eine gute Anwendung für eine persönliche Geodatabase oder eine SQLite-Datenbank (obwohl ich nicht gesehen habe, dass ArcGIS SQLite schreiben kann), wenn Sie über eine einfache Geometrie verfügen.

Es gibt ein Tool , das beschädigte Geodatabase wiederherstellt, falls sie beschädigt werden:

DPierce
quelle
2
Sie zitieren: " Sie werden möglicherweise keine Probleme bemerken, bis Sie einige Tage später auf einen bestimmten Teil der neuen Kopie zugreifen ", macht mir Angst. Es wäre wahrscheinlich viel klüger, Shapefiles anstelle einer GeoDatabase zu verwenden.
Cody Brown
Ich benutze SkyDrive seit fast einem Jahr, um Datei-GDBs ohne Probleme zu synchronisieren. Wenn Proxy-Probleme auftreten, die manchmal bedeuten, dass ich nicht auf Microsoft-Dienste zugreifen kann, schließe ich mein SkyDrive normalerweise und lasse es erst wieder synchronisieren, wenn der Zugriff wiederhergestellt wurde. Ich habe Toolboxen mit Modellen und Skripten bearbeitet, wenn mein SkyDrive geöffnet ist, aber nicht richtig synchronisiert wurde, und ich habe noch nichts verloren.
Cindy Jayakumar
1
FWIW Ich habe eine komplexe Polygonebene in einer Datei GDB bearbeitet, also habe ich Dropbox getrennt, während ich daran gearbeitet habe. Ich habe Dropbox nach der Bearbeitung wieder verbunden, sodass die Dateien gesichert wurden. 24 Stunden später sind alle meine Änderungen weg und (da ich Dropbox während der Bearbeitung getrennt hatte) gibt es keine Zwischendateien, auf die zurückgesetzt werden kann. So sieht es aus wie Dropbox kann manchmal korrupte eine File-.
Stephen Lead
8

Wenn mehrere PCs auf Dateien zugreifen müssen, erscheint es sinnvoller, mit Dropbox auf ein echtes räumliches Server-Setup zu migrieren, als auf ein Ad-hoc-Setup. Dies kann entweder ein gehosteter Server sein, auf dem ArcGIS ausgeführt wird, oder eine PostGIS-Datenbank, die auf einem Cloud-Webdienst wie AWS ausgeführt wird . Ich würde Letzteres bevorzugen. Das Einrichten erfordert etwas mehr Arbeit, aber Sie können Ihre eigenen Beziehungen definieren und auf so viele Computer skalieren, wie Sie benötigen (abhängig davon, wie Sie AWS konfigurieren), und das alles für viel weniger, als Sie Esri bezahlen würden.

Es gibt mehrere SO-Beiträge, in denen PostGIS und ArcGIS hier und hier behandelt werden . Die zweite scheint aktuellere Informationen in den Kommentaren unter der akzeptierten Antwort zu haben.

Ohne eine robustere Verarbeitung des Datenverkehrs von den verschiedenen Clients werden Sie sich wahrscheinlich ständig mit Datenkorruptionsproblemen befassen. Wenn Sie zu Shapefiles gewechselt sind , sollten Sie sich zumindest GeoGit ansehen . Auf diese Weise erhalten Sie eine grundlegende Revisionskontrolle, sodass auf einem Computer bearbeitete Shapefiles mit Änderungen von einem anderen Computer zusammengeführt werden können, ohne vollständig überschrieben zu werden.

Richard D.
quelle
Webserver sind eine großartige Möglichkeit, GIS-Daten auf mehreren PCs zu verwalten. Tatsächlich stimme ich zu, es ist wahrscheinlich der beste Weg. Das Problem dabei ist die Bandbreite und die Verarbeitungsgeschwindigkeit. Normalerweise ist die Internetgeschwindigkeit außerhalb des Standorts hoch genug, um mit den Daten zu arbeiten. Wenn ich die Daten jedoch gründlich analysieren möchte, kann ich sie auf keinen Fall über das Web übertragen. Deshalb bevorzuge ich eine Lösung wie Dropbox. Ich zeige mich vor Ort und die GeoDatabases sind alle aktuell und lokal auf dem PC gespeichert. Tolle Art zu arbeiten.
Cody Brown
3
@codybrown Aber Sie haben immer noch damit zu tun, Daten mit Dropbox über das Internet zu übertragen, ganz zu schweigen von den Synchronisierungsproblemen, die wahrscheinlich auftreten, weil das Aktualisieren von einem Client auf einen anderen so lange dauert. Zumindest ein Server wäre für diese Aufgabe optimiert. Wenn Sie wirklich nur nach einer Speicherlösung für Daten suchen, während Sie von zu Hause, von der Arbeit oder vom Client aus arbeiten, ist eine große Festplatte zum Entfernen die einzige Möglichkeit, Latenz und potenzielle Synchronisierungskonflikte zu vermeiden, vorausgesetzt, Sie sind die einzige eine, die die Daten zu einem bestimmten Zeitpunkt verwendet.
Richard D