Wo kann ich die englische Wörterbuchdatenbank in einem Textformat herunterladen? [geschlossen]

127

Ich muss die Textdatei für ein Wort lesen und ihre Bedeutung zurückgeben. Jedes andere Dateiformat funktioniert ebenfalls.

Abhi
quelle
Ich habe einen Web-Clawler für alle bekannten Online-Wörterbücher (Oxford, Longman, Cambridge, Webster und Collins) geschrieben, mit denen Sie Ihr Datset erstellen können. github.com/kiasar/Dictionary_crawler
Peyman

Antworten:

62

Das Gutenberg-Projekt beherbergt das ungekürzte englische Wörterbuch von Webster sowie viele andere gemeinfreie literarische Werke. Eigentlich sieht es so aus, als hätten sie mehrere Versionen des Wörterbuchs, die aus verschiedenen Jahren urheberrechtlich geschützt sind. Der von mir verlinkte hat ein Copyright von 2009. Vielleicht möchten Sie sich auf der Website umsehen und die verschiedenen Versionen des Webster-Wörterbuchs untersuchen.

Asaph
quelle
1
'09 bereinigtes Transkript der Version von 1913, anscheinend war die OCR nicht vollständig sauber. Es gibt insgesamt 15 Versionen auf der Website.
DragonLord
57

user1247808 hat einen guten Link zu: wget -c

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Wenn das nicht genug Worte für dich sind:

http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles-in-ns0.gz (aktualisierte URL von Michael Kropats Vorschlag)

Obwohl sich dieser Dateiname ändert, möchten Sie die neueste Version finden ... die sich als große (sehr große) Textdatei herausstellt.

http://dumps.wikimedia.org/enwiktionary/

Orwellophil
quelle
danke .. für diesen Link
AndyBoy
Sie können immer das neueste Wiktionary
Michael Kropat
androidtech / wordnet20 ist im SQL-Format nicht txt.
DragonLord
1
Bitte beachten Sie: Die Syntax im wordnet20 hat einen veralteten TYPE = * in der SQL-Datei. Führen Sie es aus sed -i 's/TYPE=/ENGINE=/g' wordnet20-from-prolog-all-3.sql, um die veraltete Syntax zu ersetzen, bevor Sie es gegen eine Version 5.0+ von MySQL ausführen
Serguei Fedorov
Keine einfache TXT-Datei mit allen englischen Wörtern?
Nadav B
27

Ich weiß nicht, ob es zu spät ist, aber ich dachte, es würde jemand anderem helfen.

Ich wollte dasselbe unbedingt ... fand es schließlich.

Vielleicht ist es nicht perfekt, aber für mich ist es angemessen (für meine kleine Wörterbuch-App).

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Es ist keine Dump-Datei, sondern eine MYSQL-SQL-Skriptdatei

Die Wörter befinden sich in der Tabelle WN_SYNSET und das Glossar / die Bedeutung in der Tabelle WN_GLOSS

user1247808
quelle
4
Unter welcher Lizenz steht das?
Cole Johnson
2
Ich bin mir auch nicht sicher, aber unter androidtech.com/html/downloads.php gibt esHere are some files related to natural language and chatterbot projects that we are making available to the public
Betlista
7
MySQL-Benutzer: Die Anweisungen zum Erstellen von Tabellen verwenden die jetzt entfernte Option TYPE. Führen Sie dies auf der Datei aus sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sql, damit es in der neuesten
Version von
15

Überprüfen Sie, ob diese kostenlosen Ressourcen Ihren Anforderungen entsprechen -

mvark
quelle
8
FOLDOC (Free Online Dictionary of Computing) scheint nur ein Wörterbuch für Computerbegriffe / -namen zu sein. Es mag für einige nützlich sein, aber es ist kein Allzweckwörterbuch, in dem Sie die meisten Wörter nachschlagen können.
Lèse majesté
2
Der Link der ObjectGraph-Seite ist ebenfalls tot. Offizielle herunterladbare Versionen finden Sie hier .
Lèse Majesté
@ Lèsemajesté Ihr Link ist jetzt auch tot
yukashima huksay