Ich suche nach einer Möglichkeit, Tabellen zu filtern, die häufig in Wikipedia-Artikeln enthalten sind, damit ich nur die Zeilen (und Spalten) vergleichen kann, an denen ich interessiert bin.
Gibt es auch nicht
- Eine integrierte Funktion in der Wikipedia-Engine, die mir nicht bekannt ist
- oder ein Browser-Plugin, das dies unterstützt
Die Funktionen, die mir einfallen, sind:
- Nach Spaltenwert filtern
- Spalten ausblenden
- Mehrstufige Sortierung
wikipedia
mediawiki
greasemonkey
Kugelfisch
quelle
quelle
Antworten:
Wenn Sie diese Formel in eine Zelle in Google Sheet einfügen, werden die tabellarischen Daten aus diesem Wikipedia-Artikel-Link entfernt: http://en.wikipedia.org/wiki/Demographics_of_India
Wenn Sie die Daten in Google - Blatt haben, können Sie durch Spaltenwert filtern (wählen Sie Spaltenkopf, wählen Sie Filter aus Daten - Menü) & auszublenden Spalte (wählen Sie Spalte, wählen Sie Ausblenden - Spalte aus dem Kontextmenü)
quelle
Tische? Meinen Sie die Infoboxen? Sie sollten wahrscheinlich Wikidata http://wikidata.org/w/api.php verwenden und die Informationen von dort extrahieren (es wird sauberer sein), und sie dann so präsentieren, wie Sie es bevorzugen.
Andernfalls können Sie
display: none
überall auf geeignete IDs und Klassen für die betreffenden Tabellen streuen , aber es wird eine endlose Jagd nach unstrukturierten Informationen sein.quelle
Das Greasemonkey-Skript des Wikipedia-Tabellenfilters macht, was Sie wollen:
Möglicherweise müssen Sie die
https
Version der Wikiedia-URL zur Filterliste der enthaltenen Seiten des Skripts hinzufügen , damit sie funktioniert.quelle