Gibt es eine Möglichkeit, den für ein bestimmtes Shapefile verwendeten Zeichensatz zu bestimmen?
25
Versuch und Irrtum. Versuchen Sie, die DBF-Datei mit MS Excel oder OpenOffice mit einer anderen Einstellung zu öffnen, bis Sie alles richtig gemacht haben.
In diesem Beitrag finden Sie weitere Hinweise: https://stackoverflow.com/questions/319095/how-do-i-determine-the-character-set-of-a-string
Es gibt zwei Möglichkeiten für Programme, den Zeichensatz für ein Shapefile zu bestimmen.
quelle
Das
file
Dienstprogramm kann die Kodierung einer Textdatei erraten. Verwenden Sie diese Optionogr2ogr
für eine Konvertierung, bei der die ursprüngliche Codierung beibehalten wird, wenn keine.cpg
Datei vorhanden ist :Beispielausgabe:
Ich habe es mit zwei der häufigsten Codierungen getestet, UTF-8 und latin1. Funktioniert in Ubuntu sofort und ist sich in Bezug auf OS X nicht sicher. Mir ist kein
file
Hilfsprogramm unter Windows bekannt.HINWEIS : Sobald eine entsprechende
.cpg
Datei vorhanden ist, die die Codierung angibt,ogr2ogr
wird diese berücksichtigt und die Ausgabe erfolgt in UTF-8. Wenn die CSV-Ausgabe jedoch richtig aussieht, wissen Sie, dass die Informationen in der.cpg
Datei korrekt sind.quelle
Eine weitere Tabelle zum Konvertieren des 29. Bytes von * .dbf in Codepage: http://webhelp.esri.com/arcpad/8.0/referenceguide/index.htm#locales/task_code.htm
quelle