Als «unicode» getaggte Fragen

235
Wie kann ich die Codierung einer Datei mit vim ändern?

Ich bin es gewohnt, mit vim die Zeilenenden einer Datei zu ändern: $ file file file: ASCII text, with CRLF line terminators $ vim file :set ff=mac :wq $ file file file: ASCII text, with CR line terminators Ist es möglich, mit einem ähnlichen Verfahren die Unicode-Codierung einer Datei zu ändern?...

216
JavaScript + Unicode-Regexe

Wie kann ich Unicode-fähige reguläre Ausdrücke in JavaScript verwenden? Zum Beispiel sollte es etwas Ähnliches geben, \wdas mit jedem Codepunkt in der Kategorie Buchstaben oder Markierungen (nicht nur mit den ASCII-Buchstaben) übereinstimmen kann und hoffentlich Filter wie [[P *]] für...

213
Python __str__ versus __unicode__

Gibt es eine Python - Konvention für , wenn Sie implementieren sollten __str__()gegenüber __unicode__(). Ich habe gesehen, dass Klassen __unicode__()häufiger überschrieben werden als, __str__()aber es scheint nicht konsistent zu sein. Gibt es bestimmte Regeln, wenn es besser ist, eine gegen die...

208
Was sind "Verbindungszeichen" in Java-Bezeichnern?

Ich lese für SCJP und habe eine Frage zu dieser Zeile: Bezeichner müssen mit einem Buchstaben, einem Währungszeichen ($) oder einem Verbindungszeichen wie dem Unterstrich (_) beginnen. Bezeichner können nicht mit einer Nummer beginnen! Es besagt, dass ein gültiger Bezeichnername mit einem...

204
Wie konvertiere ich wstring in string?

Die Frage ist, wie man wstring in string konvertiert. Ich habe nächstes Beispiel: #include <string> #include <iostream> int main() { std::wstring ws = L"Hello"; std::string s( ws.begin(), ws.end() ); //std::cout <<"std::string = "<<s<<std::endl;

169
(grep) Regex für Nicht-ASCII-Zeichen?

Unter Linux habe ich ein Verzeichnis mit vielen Dateien. Einige von ihnen haben Nicht-ASCII-Zeichen, aber alle sind gültige UTF-8 -Zeichen . Ein Programm hat einen Fehler, der verhindert, dass es mit Nicht-ASCII-Dateinamen funktioniert, und ich muss herausfinden, wie viele davon betroffen sind. Ich...

163
Unicode-Zeichen in PHP-Zeichenfolge

Diese Frage sieht peinlich einfach aus, aber ich konnte keine Antwort finden. Was entspricht PHP der folgenden C # -Codezeile? string str = "\u1000"; In diesem Beispiel wird eine Zeichenfolge mit einem einzelnen Unicode-Zeichen erstellt, dessen "numerischer Unicode-Wert" 1000 hexadezimal (4096...