Wie kratz ich HTML-Tabellen mit dem XML-Paket?
Nehmen Sie zum Beispiel diese Wikipedia-Seite über die brasilianische Fußballmannschaft . Ich möchte es in R lesen und die Tabelle "Liste aller Spiele, die Brasilien gegen von der FIFA anerkannte Mannschaften gespielt hat" als data.frame erhalten. Wie kann ich das machen?
Antworten:
… Oder ein kürzerer Versuch:
Die ausgewählte Tabelle ist die längste auf der Seite
quelle
Bearbeitet, um hinzuzufügen:
Beispielausgabe
quelle
Eine weitere Option mit Xpath.
Erzeugt dieses Ergebnis
quelle
Das
rvest
zusammen mitxml2
ist ein weiteres beliebtes Paket zum Parsen von HTML-Webseiten.Die Syntax ist einfacher zu verwenden als das
xml
Paket und für die meisten Webseiten bietet das Paket alle Optionen, die benötigt werden.quelle