Ich habe ein Textdokument, das auf Russisch geschrieben werden soll, aber es scheint stattdessen ASCII zu sein:
Óñòàíîâêà:
1)Çàïóñêàåì QuidamStudioSetup3.15.exe
2)Ïðè çàïðîñå ñåðèéíîãî íîìåðà ââîäèì
Wie kann ich das in russische Unicode-Zeichen konvertieren, die lesbar sind?
Antworten:
Es ist nicht "ASCII" oder "ASCII-Russisch".
Vor der Verbreitung von Unicode verwendeten die meisten Computersysteme die ISO-8859-Zeichencodierungen, von denen es 16 gab, jeweils für eine andere Region (mitteleuropäisch, kyrillisch, griechisch ...). Windows hatte seine eigenen "Codepages", die sehr ähnlich waren, aber zusätzliche Glyphen in ansonsten nicht verwendeten Bereichen enthielten. Alle diese Zeichenkodierungen sind 8-Bit und unterscheiden sich nur in der zweiten Hälfte (128-255).
Das Problem bei diesen Codierungen ist, dass es für ein Programm so gut wie unmöglich ist, dies zu bestimmen welche Die Codierung wurde zum Speichern einer Datei verwendet, es sei denn, sie wurde ausdrücklich angegeben (z. B. in HTML-Seiten; Nur-Text-Dateien haben jedoch keine solchen Metadaten-Tags). Lesen Sie den Wikipedia-Artikel auf Mojibake für eine detailliertere Beschreibung.
In Ihrem Beispiel wurde das Dokument mit gespeichert Windows-1251 (Kyrillisch), aber Ihr Programm liest es so, als ob es wäre Windows-1252 (Westeuropäisch), die in den gleichen Positionen sehr unterschiedliche Charaktere hat. Für den Computer sieht es vollkommen in Ordnung aus - er versteht keine Sprachen oder Skripte. (Es gibt jedoch Programme, die statistische Analysen durchführen, um die korrekte Codierung zu ermitteln. Einige Webbrowser verfügen über eine solche Funktion.)
Es gibt verschiedene Möglichkeiten, wie Sie solchen Text in Unicode konvertieren können:
Benutzen Online-Tools wie dieses oder dieses .
Verwenden Sie Ihren Webbrowser:
Zieh den
.txt
Datei in den Browser.Von Ansicht → Zeichenkodierung (oder Firefox → Webentwickler → Zeichenkodierung , oder Schraubenschlüssel → Werkzeuge → Kodierung ), wählen Sie die richtige Originalkodierung: "Kyrillisch (Windows-1251)" in Ihrem Fall.
Verwenden Sie die Notepad2 Texteditor:
Öffne die Datei.
Von Datei → Codierung → Neu codieren ... , wählen Sie die richtige Originalkodierung.
Verwenden Sie GNU
iconv
, mit Windows-Binärdateien entweder von GnuWin32 oder Gettext für Win32 .Windows Notepad liest UTF-8- und UTF-16-codierten Text korrekt.
quelle
Sie können die Codierung mit einem Programm wie z iconv - Sie müssen jedoch wissen, welche Codierung verwendet wurde.
Es scheint Windows-1251 laut a zu sein zufällige Webseite von Google gefunden.
Ich kann kein Russisch, aber das Einfügen in translate.google.com legt nahe, dass das oben Genannte plausibel ist:
So ...
Sollte Ihre Testdatei in etwas konvertieren, das im Editor geöffnet und gelesen werden kann
quelle