Wie können wir Text aus Wikipedia ohne die Zitierteile "[1]", "[2]", "[3]" kopieren?

9

Wenn wir Text von einer Wikipedia-Seite kopieren, erhalten wir ungefähr Folgendes:

Der Satzabstand ist der horizontale Abstand zwischen Sätzen im gesetzten Text. Es ist eine Frage der typografischen Konvention. [1] Seit der Einführung des beweglichen Drucks in Europa wurden verschiedene Konventionen für Satzabstände in Sprachen mit einem von Latein abgeleiteten Alphabet verwendet. [2] Dazu gehören ein normaler Wortraum (wie zwischen den Wörtern in einem Satz), ein einzelner vergrößerter Raum, zwei volle Räume und zuletzt in digitalen Medien kein Raum. [3] Obwohl moderne digitale Schriftarten automatisch einen einzelnen Wortraum anpassen können, um nach der Interpunktion des Terminals einen optisch ansprechenden und konsistenten Abstand zu schaffen. [4] In den meisten Debatten geht es darum, ob die Leertaste einer Tastatur ein- oder zweimal zwischen Sätzen gedrückt werden soll. [5]

Ich möchte nicht , um die Teile kopieren [1]und [2]usw. Das ist eigentlich das, was ich kopieren wollte:

Der Satzabstand ist der horizontale Abstand zwischen Sätzen im gesetzten Text. Es ist eine Frage der typografischen Konvention. Seit der Einführung des beweglichen Drucks in Europa wurden verschiedene Satzabstandskonventionen in Sprachen mit einem von Latein abgeleiteten Alphabet verwendet. Dazu gehören ein normaler Wortraum (wie zwischen den Wörtern in einem Satz), ein einzelner vergrößerter Raum, zwei volle Räume und zuletzt in digitalen Medien kein Raum. Obwohl moderne digitale Schriftarten automatisch einen einzelnen Wortraum anpassen können, um nach der Interpunktion des Terminals einen optisch ansprechenden und konsistenten Abstand zu schaffen, geht es in den meisten Debatten darum, ob die Leertaste einer Tastatur zwischen Sätzen ein- oder zweimal gedrückt werden soll.

Die unten ausgewählte Antwort verwendet Regex, funktioniert jedoch nicht jedes Mal . (Wenn der eigentliche Text selbst enthält [und ]der reguläre Ausdruck sie nicht entfernen sollte.)

Gibt es bessere Lösungen?

Pacerier
quelle
Dies sind Referenzen, die wahrscheinlich wichtig sind, weil sie häufig die Glaubwürdigkeit der präsentierten Informationen unterstützen. Das Einfügen von Referenzen ist insbesondere für Forscher hilfreich.
Randolf Richardson
@Randolf Das Einfügen von Referenzen kann insbesondere für Forscher hilfreich sein. Nicht für normale Wesen, die nur die Informationen wollen
Pacerier
Die Such- und Ersetzungsfunktion Ihres Textverarbeitungsprogramms, die möglicherweise von einem Makro aufgerufen wird, könnte hier nützlich sein.
Keith
Ich habe Ihre Frage übrigens positiv bewertet, weil ich denke, dass es eine gute ist. In Bezug auf Referenzen erwarten viele Menschen, dass sie sie sehen, insbesondere Professoren an der Universität (wenn Sie vorhaben, eine zu besuchen, werden Sie mit ziemlicher Sicherheit feststellen, dass die meisten Professoren erwarten, dass Referenzen in allen von Ihnen verfassten Forschungsarbeiten enthalten sind, und Sie werden es wahrscheinlich tun andere Schüler von Zeit zu Zeit über Referenzen sprechen hören).
Randolf Richardson
@ Randolf Ich meine, ich möchte nur die Informationen für das persönliche zukünftige Lesen und Verwenden speichern.
Pacerier

Antworten:

9

Ein Lesezeichen ist dein Freund ...

Erstellen Sie ein neues Browser-Lesezeichen und kopieren Sie den folgenden Javascript-Code hinein. Wenn Sie Text aus Wikipedia kopieren möchten, klicken Sie einfach vorher darauf und alle Instanzen von [n] werden entfernt , um Ihre Anforderungen in der Frage zu erfüllen.

javascript:function a (){document.body.innerHTML=document.body.innerHTML.replace(/<sup\b[^>]*>(.*?)<\/sup>/gi, "" );return;}; a();

Hinter den Kulissen werden lediglich alle <sup>...</sup>HTML-Tags auf der Seite nach regulären Ausdrücken gesucht und ersetzt .

Ich habe es gerade in IE7 versucht und es funktioniert gut, also sollte es hoffentlich auch in anderen Browsern in Ordnung sein.

Ich werde diesem SO-Thread zuschreiben, dass er mich in die richtige Richtung gelenkt hat - ich wusste, dass ein Lesezeichen der richtige Weg ist, hatte aber noch nie zuvor eines geschrieben.

Stuart McLaughlin
quelle
1
+1, das ist der einzige Weg, wie ich mir das vorstellen kann. Sogar zusätzliche Browser-Erweiterungen müssten eine Art Javascript-Analyse verwenden, um dies zu tun (und tatsächlich tun es die meisten).
Durchbruch