Als «parsing» getaggte Fragen

92
Wie analysiere ich eine HTML-Seite mit Node.js.

Ich muss (serverseitig) große Mengen von HTML-Seiten analysieren. Wir sind uns alle einig, dass Regexp nicht der richtige Weg ist. Es scheint mir, dass Javascript die native Methode zum Parsen einer HTML-Seite ist, aber diese Annahme beruht darauf, dass der serverseitige Code alle DOM-Fähigkeiten...

91
Sind Zeilenumbrüche in XML-Attributwerten zulässig?

Mir ist klar, dass es nicht elegant oder erwünscht ist, aber darf ein Attributwert in einem XML-Element (in wohlgeformtem XML) mehrere Zeilen umfassen? z.B <some-xml-element value="this value goes over.... multiple lines!" /> Ja, mir ist klar, dass es bessere Möglichkeiten gibt, das zu...

90
Was macht Java einfacher zu analysieren als C?

Ich bin mit der Tatsache vertraut, dass die Grammatiken von C und C ++ kontextsensitiv sind , und insbesondere benötigen Sie einen "Lexer-Hack" in C. Andererseits habe ich den Eindruck, dass Sie nur Java analysieren können 2 Zeichen Vorausschau, trotz erheblicher Ähnlichkeit zwischen den beiden...

86
Python: Wie bestimme ich die Sprache?

Ich möchte das bekommen: Input text: "ру́сский язы́к" Output text: "Russian" Input text: "中文" Output text: "Chinese" Input text: "にほんご" Output text: "Japanese" Input text: "العَرَبِيَّة" Output text: "Arabic" Wie kann ich das in Python machen? Vielen Dank....

84
Wie kann ich Dateien mit fester Breite effizient analysieren?

Ich versuche, eine effiziente Methode zum Parsen von Dateien zu finden, die Linien mit fester Breite enthalten. Zum Beispiel repräsentieren die ersten 20 Zeichen eine Spalte, ab 21:30 eine andere und so weiter. Angenommen, die Zeile enthält 100 Zeichen. Was wäre eine effiziente Methode, um eine...