Als «html-parsing» getaggte Fragen

Beim HTML-Parsing wird eine Serialisierung eines HTML-Dokuments verbraucht und eine Darstellung erstellt, mit der Sie programmgesteuert arbeiten können, z. B. um Daten daraus zu extrahieren. Die HTML-Spezifikation definiert einen Standardalgorithmus zum Parsen von HTML, der in allen gängigen Browsern implementiert ist.

258
Analysieren Sie eine HTML-Zeichenfolge mit JS

Ich habe nach einer Lösung gesucht, aber nichts war relevant. Hier ist mein Problem: Ich möchte eine Zeichenfolge analysieren, die HTML-Text enthält. Ich möchte es in JavaScript tun. Ich habe diese Bibliothek ausprobiert, aber es scheint, dass sie den HTML-Code meiner aktuellen Seite analysiert,...

185
Analysieren von HTML mit Python

Ich suche nach einem HTML-Parser-Modul für Python, mit dem ich die Tags in Form von Python-Listen / Wörterbüchern / Objekten erhalten kann. Wenn ich ein Dokument des Formulars habe: <html> <head>Heading</head> <body attr1='val1'> <div class='container'> <div...

92
Wie analysiere ich eine HTML-Seite mit Node.js.

Ich muss (serverseitig) große Mengen von HTML-Seiten analysieren. Wir sind uns alle einig, dass Regexp nicht der richtige Weg ist. Es scheint mir, dass Javascript die native Methode zum Parsen einer HTML-Seite ist, aber diese Annahme beruht darauf, dass der serverseitige Code alle DOM-Fähigkeiten...