Gibt es ein Befehlszeilentool zum Anzeigen / Öffnen von Excel-Dateien (.xls)?
Die Antwort funktioniert also hervorragend, es sei denn, die Arbeitsblätter haben keinen benutzerdefinierten Namen.
Wenn ich versuche, die Datei zu öffnen, erhalte ich:
Traceback (most recent call last):
File "/usr/bin/py_xls2csv", line 17, in <module>
for sheet_name, values in parse_xls(arg, 'cp1251'): # parse_xls(arg) -- default encoding
File "/usr/lib/python2.5/site-packages/pyExcelerator/ImportXLS.py", line 334, in parse_xls
raise Exception, 'No workbook stream in file.'
Exception: No workbook stream in file.
Wenn ich jedoch die Datei öffne und das Blatt in "Test" oder etwas anderes umbenenne, funktioniert es einwandfrei. Was muss ich tun, damit es die Standardnamen handhaben kann? (Sheet1, etc)
Die Datei, die ich derzeit zu öffnen versuche, hat nur 1 Blatt mit dem Namen Sheet1.
quelle
links -dump /tmp/tempspreadsheet.html
..... Auch: wie es ist, druckt es Unicode-Zeichen im\u0950
Format ... Vielleicht gibt es eine Möglichkeit, die Ausgabe zu verarbeiten, um das Unicode-Zeichen zu erzeugen ... Wenn jemand ein " simple "way, ich würde es gerne sehen ...w3m
jetzt umgestellt (weil es nur schöner aussieht) und das hat einige Zeichensatzoptionen (siehew3m --help
). Ich habe auch die Länge gekürzt, einschließlich der Notwendigkeit, sie in eine Datei zu leiten.py_xls2csv
hartcodiert wird mit zur Arbeit Codepagecp1251
.. Ich habe , dass die drei Fälle von Substitution gefundencp1251
mitutf-8
löst das ‚Problem“ der nicht angezeigt Unicode - Zeichen ... Ich nehme an, es hängt davon ab , was in der Tabellenkalkulation ist. aber mit utf-8 arbeitete für mich ... (Ich merkte das erst, nachdem ich meine Antwort gepostet hatte, aber es könnte für andere Konvertierungen von Nutzen sein)html
mehrere Leerzeichen enthält, zeigt die gerenderte Ausgabe diese als einzelnes Leerzeichen an (typisch für HTML). . dh ..<td> cows moo </td>
Displays wiecows moo
... ist wahrscheinlich einige einfachen zwicken für diese gibt, aber meine hTML - Kenntnisse nicht weit über die Lage zu buchstabieren ‚html‘ gehen .. :)Hier ist eine Methode, die die Unicode-Zeichen verwaltet.
dh Es wird angezeigt
आ
, anstatt den Unicode-Codepoint-Wert zu verschieben\U0906
Das Skript verwendet OpenOffice.org und PyODConverter.py , um ein OOo-Dokumentformat in ein anderes OOo-Format zu konvertieren. Die Konvertierungstypen basieren auf den Dateinamenerweiterungen:
Es gibt wahrscheinlich einen anderen Weg, um OOo zu beenden (aber ich weiß es nicht).
Und es gibt wahrscheinlich auch einen Weg, um eine unabhängige Instanz von OOo zu starten, aber ich weiß auch nicht, wie das geht, so wie es ist. es setzt voraus, dass OOo nicht läuft ...
quelle