Ich rufe count-words-region
( M-x =) für eine US / RU / IPA-Zeichenfolge auf:
HelloПривheləʊ
Die folgende Meldung wird gedruckt:
Region has 1 line, 4 words, and 14 characters.
Alle Symbole haben eine w
Syntax, unterscheiden sich jedoch im Skript:
(char-syntax ?H) ; ?w
(char-syntax ?П) ; ?w
(char-syntax ?ʊ) ; ?w
(aref char-script-table ?H) ; script: latin
(aref char-script-table ?П) ; script: cyrillic
(aref char-script-table ?ʊ) ; script: phonetic
Bedeutet das, dass die Wortgrenze nicht nur durch die Zeichensyntax, sondern auch durch das Zeichenskript definiert wird ?
Ich möchte dieses Verhalten für ausgewählte Modi deaktivieren, um über Wörter, aber nicht über Skripte navigieren zu können. Wie kann dies erreicht werden?
M-x report-emacs-bug
aktualisieren Sie die Dokumentation.In der Tat
forward-word
undbackward-word
auch zeigen, dass es hier mehrere Wörter gibt. Es macht für mich Sinn, dass Zeichen aus verschiedenen Skripten nicht dasselbe Wort enthalten können, aber die Dokumentation sollte diesbezüglich explizit angegeben werden ( hier ). Ich schlageM-x report-emacs-bug
vor.Wenn Sie sich nur über "Wörter" bewegen möchten, ohne das Skript zu beachten, können Sie
skip-syntax-forward
undskip-syntax-backward
( hier beschrieben ) verwenden.quelle