Konvertieren von Ascii Russisch zu Russisch?

4

Ich habe ein Textdokument, das auf Russisch geschrieben werden soll, aber es scheint stattdessen ASCII zu sein:

Óñòàíîâêà:
1)Çàïóñêàåì QuidamStudioSetup3.15.exe
2)Ïðè çàïðîñå ñåðèéíîãî íîìåðà ââîäèì

Wie kann ich das in russische Unicode-Zeichen konvertieren, die lesbar sind?

jmasterx
quelle
Öffnen Sie die Datei in MS Word. Es kann die Codierung die meiste Zeit richtig erraten
phuclv

Antworten:

9

Es ist nicht "ASCII" oder "ASCII-Russisch".

Vor der Verbreitung von Unicode verwendeten die meisten Computersysteme die ISO-8859-Zeichencodierungen, von denen es 16 gab, jeweils für eine andere Region (mitteleuropäisch, kyrillisch, griechisch ...). Windows hatte seine eigenen "Codepages", die sehr ähnlich waren, aber zusätzliche Glyphen in ansonsten nicht verwendeten Bereichen enthielten. Alle diese Zeichenkodierungen sind 8-Bit und unterscheiden sich nur in der zweiten Hälfte (128-255).

Das Problem bei diesen Codierungen ist, dass es für ein Programm so gut wie unmöglich ist, dies zu bestimmen welche Die Codierung wurde zum Speichern einer Datei verwendet, es sei denn, sie wurde ausdrücklich angegeben (z. B. in HTML-Seiten; Nur-Text-Dateien haben jedoch keine solchen Metadaten-Tags). Lesen Sie den Wikipedia-Artikel auf Mojibake für eine detailliertere Beschreibung.

In Ihrem Beispiel wurde das Dokument mit gespeichert Windows-1251 (Kyrillisch), aber Ihr Programm liest es so, als ob es wäre Windows-1252 (Westeuropäisch), die in den gleichen Positionen sehr unterschiedliche Charaktere hat. Für den Computer sieht es vollkommen in Ordnung aus - er versteht keine Sprachen oder Skripte. (Es gibt jedoch Programme, die statistische Analysen durchführen, um die korrekte Codierung zu ermitteln. Einige Webbrowser verfügen über eine solche Funktion.)

Es gibt verschiedene Möglichkeiten, wie Sie solchen Text in Unicode konvertieren können:

  • Benutzen Online-Tools wie dieses oder dieses .

  • Verwenden Sie Ihren Webbrowser:

    1. Zieh den .txt Datei in den Browser.

    2. Von Ansicht → Zeichenkodierung (oder Firefox → Webentwickler → Zeichenkodierung , oder Schraubenschlüssel → Werkzeuge → Kodierung ), wählen Sie die richtige Originalkodierung: "Kyrillisch (Windows-1251)" in Ihrem Fall.

  • Verwenden Sie die Notepad2 Texteditor:

    1. Öffne die Datei.

    2. Von Datei → Codierung → Neu codieren ... , wählen Sie die richtige Originalkodierung.

  • Verwenden Sie GNU iconv, mit Windows-Binärdateien entweder von GnuWin32 oder Gettext für Win32 .

    iconv -f  cp1251  -t utf-8 & lt;  myfile.txt  & gt;  myfile.fixed.txt 

    Windows Notepad liest UTF-8- und UTF-16-codierten Text korrekt.

grawity
quelle
3

Sie können die Codierung mit einem Programm wie z iconv - Sie müssen jedoch wissen, welche Codierung verwendet wurde.

Es scheint Windows-1251 laut a zu sein zufällige Webseite von Google gefunden.

Установка:
1) Запускаем QuidamStudioSetup3.15.exe
2) При запросе серийного номера вводим

Ich kann kein Russisch, aber das Einfügen in translate.google.com legt nahe, dass das oben Genannte plausibel ist:

Installation:
1) Führen Sie QuidamStudioSetup3.15.exe aus
2) Geben Sie die Seriennummer ein, wenn Sie dazu aufgefordert werden

So ...

iconv -f 1252 -t UTF-8 document.txt

Sollte Ihre Testdatei in etwas konvertieren, das im Editor geöffnet und gelesen werden kann

RedGrittyBrick
quelle
Ich kann Russisch und du hast recht, es ist Windows-1251.
haimg