Als «utf-8» getaggte Fragen

143
Ändern der Standardcodierung von Python?

Ich habe viele Probleme mit Python, bei denen ich meine Anwendungen von der Konsole aus ausführen kann. Aber in der Eclipse PyDev IDE ist die Standardzeichenkodierung auf UTF-8 eingestellt , und mir geht es gut. Ich habe nach der Einstellung der Standardcodierung gesucht und die Leute sagen, dass...

137
Unterschied zwischen UTF-8 und UTF-16?

Unterschied zwischen UTF-8 und UTF-16? Warum brauchen wir diese? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest =

135
Unicode-Zeichen in URLs

Würden Sie 2010 URLs mit UTF-8-Zeichen in einem großen Webportal bereitstellen? Unicode-Zeichen sind gemäß RFC für URLs verboten (siehe hier ). Sie müssten prozentual codiert sein, um standardkonform zu sein. Mein Hauptpunkt ist jedoch, die nicht codierten Zeichen nur für gut aussehende URLs...

122
Warum Unicode per String in Python deklarieren?

Ich lerne immer noch Python und habe Zweifel: In Python 2.6.x deklariere ich normalerweise die Codierung im Dateikopf wie folgt (wie in PEP 0263 ). # -*- coding: utf-8 -*- Danach werden meine Strings wie gewohnt geschrieben: a = "A normal string without declared Unicode" Aber jedes Mal, wenn ich...

112
Serialisieren eines Objekts als UTF-8-XML in .NET

Die ordnungsgemäße Objektentsorgung wurde der Kürze halber entfernt, aber ich bin schockiert, wenn dies der einfachste Weg ist, ein Objekt als UTF-8 im Speicher zu codieren. Es muss einen einfacheren Weg geben, nicht wahr? var serializer = new XmlSerializer(typeof(SomeSerializableObject)); var...

112
Warnung "Nicht zuordnbares Zeichen zum Codieren" in Java

Ich arbeite derzeit an einem Java-Projekt, das beim Kompilieren die folgende Warnung ausgibt: /src/com/myco/apps/AppDBCore.java:439: warning: unmappable character for encoding UTF8 [javac] String copyright = "� 2003-2008 My Company. All rights reserved."; Ich bin nicht sicher, wie SO das Zeichen...

110
SET NAMES utf8 in MySQL?

Ich sehe oft etwas Ähnliches in PHP-Skripten, die MySQL verwenden query("SET NAMES utf8"); Ich musste dies noch nie für ein Projekt tun, daher habe ich ein paar grundlegende Fragen dazu. Wird dies nur mit PDO durchgeführt? Wenn es sich nicht um eine gU-spezifische Sache handelt, wozu dient...

110
Wie kann ich UTF-8 von Perl ausgeben?

Ich versuche, ein Perl-Skript mit dem Pragma "utf8" zu schreiben, und erhalte unerwartete Ergebnisse. Ich verwende Mac OS X 10.5 (Leopard) und bearbeite mit TextMate. Alle meine Einstellungen für meinen Editor und mein Betriebssystem sind standardmäßig auf das Schreiben von Dateien im utf-8-Format...

109
Ruby 1.9: Ungültige Bytesequenz in UTF-8

Ich schreibe einen Crawler in Ruby (1.9), der viel HTML von vielen zufälligen Sites verbraucht. Beim Versuch, Links zu extrahieren, habe ich mich entschieden, .scan(/href="(.*?)"/i)anstelle von nokogiri / hpricot (größere Beschleunigung) zu verwenden. Das Problem ist, dass ich jetzt viele "...