Wie kann ich alle Seiten anzeigen, die von einem bestimmten Wikipedia-Benutzer erstellt wurden?

7

Für jeden Benutzer auf Wikipedia möchte ich herausfinden, welche Seiten von diesen Benutzern erstellt wurden. Wie finde ich alle Seiten, die von einem bestimmten Wikipedia- oder Mediawiki-Benutzer erstellt wurden?

Anderson Green
quelle
Natürlich ist es möglich, den Ersteller einer Seite zu finden, indem Sie zur ersten Bearbeitung im Revisionsverlauf der Seite zurückkehren. Ich möchte eine Liste aller Seiten finden, die von einem bestimmten Benutzer erstellt wurden.
Anderson Green
Ich gehe davon aus, dass Sie kein Konto auf dem Toolserver haben , oder?
Svick
Nein, ich habe noch kein Konto auf dem Toolserver. Wie ist das für meine Frage relevant?
Anderson Green

Antworten:

3

Soweit ich weiß, gibt es keinen einfachen Weg, dies zu tun. Aber ich sehe einige Möglichkeiten (beginnend mit denen, die praktisch nicht funktionieren):

  1. Verwenden Sie die API. Die API hat keine direkte Möglichkeit, dies zu tun, aber Sie könnten versuchen, dies zu umgehen:

    1. Gehen Sie alle Seiten durch und finden Sie für jede Seite den Ersteller heraus. Aufgrund der Einschränkungen der API bei der Arbeit mit Revisionen würde dies 1 Anfrage pro Seite bedeuten, was dies für ein so großes Wiki wie Wikipedia völlig unmöglich macht.

      Die erste Abfrage würde ungefähr so ​​aussehen: http://en.wikipedia.org/w/api.php?action=query&generator=allpages&gaplimit=1&prop=revisions&rvdir=newer&rvprop=user&rvlimit=1

    2. Gehen Sie für jeden Benutzer seine Beiträge durch und finden Sie heraus, welche seiner Änderungen eine neue Seite erstellt haben. Da Sie mit der API die Beiträge nicht filtern können, um nur Seitenerstellungen anzuzeigen, müssen Sie diese selbst filtern. Dies wäre wahrscheinlich viel schneller als die obige Option, aber für Wikipedia immer noch viel zu langsam:

      Die Abfrage für Benutzer: Svick würde folgendermaßen aussehen: http://en.wikipedia.org/w/api.php?action=query&list=usercontribs&ucuser=Svick&ucprop=title|flags&uclimit=max

  2. Laden Sie den Stub-Meta-History-Dump (32 GB, komprimiert für die englische Wikipedia) herunter, der Informationen zu Revisionen aller Seiten in XML enthält. Sie können dies durchgehen, um den Ersteller jeder Seite herauszufinden (vorausgesetzt, es wurden keine Revisionen gelöscht).

  3. Auf dem Wikimedia Toolserver führe ich ein Skript aus (ursprünglich nicht von mir geschrieben), das die Tabelle regelmäßig aktualisiert u_svick_enwiki_page_creators_pund Informationen zu Benutzern enthält, die jede Seite erstellt haben. Diese Tabelle ist für andere Benutzer des Toolservers zugänglich, jedoch nicht für die Öffentlichkeit.

Zusammenfassend lässt sich sagen, dass es keine gute Lösung gibt und Sie zwei Möglichkeiten haben: 32 GB Daten herunterladen und analysieren oder ein Toolserver-Konto einrichten und dann die von mir erwähnte Tabelle verwenden.

svick
quelle
4

Ab Wikimedia 1.23 kann dies mit dem UsercontribsModul in der API über die newOption des ucshowParameters erfolgen.

Hypercube
quelle