Als «unicode» getaggte Fragen

152
u '\ ufeff' in Python-String

Ich erhalte eine Fehlermeldung mit folgendem Muster: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) u'\ufeff'Ich bin mir nicht sicher, was es ist. Es zeigt sich, wenn ich Web Scraping mache. Wie kann ich Abhilfe schaffen? Die...

146
Python, Unicode und die Windows-Konsole

На этот вопрос есть ответы на Stapelüberlauf на русском : Как из Python вывести на Windows-консоль строку в Юникоде? Wenn ich versuche, eine Unicode-Zeichenfolge in einer Windows-Konsole zu drucken, wird eine UnicodeEncodeError: 'charmap' codec can't encode character ....Fehlermeldung angezeigt....

142
Python-String wird als [u'String '] gedruckt

На этот вопрос есть ответы на Stack Overflow на русском : по кодировкам utf-8 выдает результат по-разном Dies wird sicherlich leicht sein, aber es nervt mich wirklich. Ich habe ein Skript, das eine Webseite einliest und Beautiful Soup verwendet , um sie zu analysieren. Aus der Suppe extrahiere ich...

137
Unterschied zwischen UTF-8 und UTF-16?

Unterschied zwischen UTF-8 und UTF-16? Warum brauchen wir diese? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest =

135
Unicode-Zeichen in URLs

Würden Sie 2010 URLs mit UTF-8-Zeichen in einem großen Webportal bereitstellen? Unicode-Zeichen sind gemäß RFC für URLs verboten (siehe hier ). Sie müssten prozentual codiert sein, um standardkonform zu sein. Mein Hauptpunkt ist jedoch, die nicht codierten Zeichen nur für gut aussehende URLs...

133
Fügen Sie ein Unicode-Zeichen in JavaScript ein

Ich muss ein Omega (Ω) in meine HTML-Seite einfügen. Ich verwende dazu den HTML-Code, damit ich ΩΩ schreiben und erhalten kann. Das ist alles in Ordnung und gut, wenn ich es in ein HTML-Element einfüge. Wenn ich jedoch versuche, es in mein JS var Omega = Ωeinzufügen, analysiert es...

130
Java FileReader-Codierungsproblem

Ich habe versucht, mit java.io.FileReader einige Textdateien zu lesen und in eine Zeichenfolge zu konvertieren, aber ich habe festgestellt, dass das Ergebnis falsch codiert und überhaupt nicht lesbar ist. Hier ist meine Umgebung: Windows 2003, Betriebssystemcodierung: CP1252 Java 5.0 Meine Dateien...

129
Worum geht es bei normalisiertem UTF-8?

Das ICU-Projekt (das jetzt auch eine PHP-Bibliothek enthält) enthält die Klassen, die zur Normalisierung von UTF-8-Zeichenfolgen erforderlich sind, um den Vergleich von Werten bei der Suche zu erleichtern. Ich versuche jedoch herauszufinden, was dies für Anwendungen bedeutet . In welchen Fällen...

127
Was ist der HTML-Zeichencode 8203?

Was bedeutet der Zeichencode (HTML) &#8203;? Ich fand es in einem meiner jQuery-Skripte und fragte mich, was es war. Vielen Dank. Bearbeiten: Hier ist das Skript, in dem es war (es wurde am Ende hinzugefügt und in Firebug gefunden) <script src="http://code.jquery.com/jquery-latest.js"...