Ist es möglich, MediaWiki-Websites mit regulären Ausdrücken zu durchsuchen?

9

Ich möchte nach Phrasen mit regulären Ausdrücken auf Websites wie Wikipedia und Wikimedia Commons suchen. Ist das möglich?

Beispiel für eine Regex-Suchabfrage: (Facebook | Google) (Unternehmensverlauf | Websites)

Bei Google ist dies bereits möglich ( wie hier gezeigt ). Daher möchte ich wissen, ob dies auch für Wikipedia möglich ist.

Anderson Green
quelle
Wären Sie bereit, mehrere Gigabyte Daten herunterzuladen und die gesamte Filterung auf Ihrem eigenen Computer durchzuführen?
Svick
Es scheint, dass dies mit AutoWikiBrowser möglich ist: en.wikipedia.org/wiki/Wikipedia:AutoWikiBrowser/…
Anderson Green
Sie können AWB verwenden, um eine bestimmte Seite (oder eine Reihe von Seiten) zu durchsuchen, aber nicht das gesamte Wiki, von dem ich angenommen habe, dass es das ist, was Sie wollten.
Svick
Ja, ich wollte das gesamte Wiki durchsuchen. Gibt es dafür Tools auf dem Toolserver?
Anderson Green

Antworten:

3

Es ist möglich, Wikipedia (oder jede andere Website, auf die eine Suchmaschine zugreifen kann) mit einfachen regulären Ausdrücken zu durchsuchen, sofern Sie sich auf eine Suchmaschine verlassen. Die folgende Google-Suchabfrage durchsucht Wikipedia nach Übereinstimmungen mit dem regulären Ausdruck (Yahoo|Google|Microsoft):

https://www.google.com/#hl=de&sclient=psy-ab&q=site:de.wikipedia.org+(google+OR+yahoo+OR+microsoft)&oq=site:en.wikipedia.org+(google+OR + yahoo + OR + microsoft) & gs_l = hp.3 ... 87411.96861.2.97076.26.24.2.0.0.0.79.1141.24.24.0 ... 0.0 ... 1c.1.7.psy-ab.s2oGD_2LKy4 & pbx = 1 & bav = on .2 oder.r_cp.r_qf. & Bvm = bv.44158598, d.dmg & fp = dc8abc04c054405e & biw = 1366 & bih = 639

Anderson Green
quelle
2

Wenn Sie nur an einer Regex-Suche nach Wikipedia- Titeln interessiert sind , können Sie dies mit Crossword Nexus tun. http://crosswordnexus.com/wiki

Alex B.
quelle
2

Es ist verfügbar und wird von CirrusSearch (basierend auf ElasticSearch ), der in den MediaWiki-Websites verwendeten Suchmaschine, und der Wikimedia-Plattform unterstützt.

Einige Anwendungsbeispiele:

Hinweis: Vollständige Referenz und Quelle des Handbuchs - auf Wikipedia: Hilfe: Suche nach # Search_string_syntax .

Wie für Ihre Frage:

Logische Operatoren

Die Suchmaschine unterstützt boolesche Logik bei Suchvorgängen. Die logischen Operatoren enthalten das Zeichen "-" (Minuszeichen) für "logisch nicht", das UND, das ODER und die Klammern in Gruppierungsklammern: (_).

Logisches ODER muss in Großbuchstaben geschrieben werden. Der AND-Operator wird für alle Begriffe (durch Leerzeichen getrennt) angenommen, aber das Großbuchstaben AND ist äquivalent.

Mehr Beispiele:

  • Einfach AND, OR: "credit card" OR "payment card", "credit card" AND "payment card"- funktioniert wie erwartet.
  • Suffixed Tilde - Zeichen für die Fuzzy - Suche ( „klingt wie“) - zum Beispiel für die Suche charlie~ parker~zurückkehrt Charlie Parker, Charles Palmer, Charley Parks(bis zu zwei Zeichen Unterschied, nicht einschließlich dem ersten).
  • Wildcard-Suche - Suche face*e- beginnt mit faceund endet mit einem emit irgendetwas in der Mitte. Geben Sie hier die Bildbeschreibung ein

Zusätzliche Lektüre

Lesen Sie mehr über die Suchmaschine und diese Erweiterung , um deren volle Funktionalität und Merkmale zu enthüllen.

Arieljannai
quelle