Wörterbuch-Textdatei [geschlossen]

222

Ich schreibe ein Programm, das viele Wörter der englischen Sprache benötigt. Ich versuche eine Wörterbuchdatei zu finden, die viele Wörter enthält. Kennt jemand eine gute Quelle? Ich habe viele Quellen ausprobiert, aber sie scheinen es nicht zu haben.

SuperString
quelle
3
@DWright Ich habe es nicht gelöscht, sondern geschlossen, da es für die aktuellen Erwartungen an Stack Overflow nicht zum Thema gehört. Es wird ausdrücklich um Empfehlungen gebeten, Links, die nicht zum Thema gehören.
Taryn
Richtig, ich hatte vergessen, dass On Hold auf Closed geht, nicht gelöscht.
DWright
Also, @bluefeet, entschuldigen Sie meinen 'protestierenden' Kommentar, der falsch informiert wurde. Ihre Aktion ist korrekt und zieht keinen Wert ab.
DWright
15
Warum entschuldigen? Es hat eindeutig einen Wert für die SO-Community. Die "aktuellen Erwartungen" von SO verfehlen deutlich die Marke.
Andrew

Antworten:

224

Was ist mit /usr/share/dict/wordseinem Unix-System? Über wie viele Wörter sprechen wir? Wie OED-ungekürzt?

Robert
quelle
20
Vielen Dank ! 200000+ Wörter, sehr geschätzt! cat /usr/share/dict/words > words.txtall die Dinge !
Jokoon
7
Wenn Sie diese Datei vermissen, können Sie sie auf Debian / Ubuntu installieren, indem Siesudo apt-get install wbritish
airstrike
17
Kennt zufällig jemand einen Ort, an dem dies für Nicht-Unix-Systeme heruntergeladen werden kann?
Tom
2
@ Tom Yeah, www.FreeBSD.org (installieren Sie FreeBSD irgendwo und boomen Sie, Sie haben es). Ansonsten denke ich, dass diese Liste ähnlich ist: raw.githubusercontent.com/eneko/data-repository/master/data/… .
Greg Schmit
2
Falls Sie nicht wussten: Dies wird auch unter MacOS funktionieren :)
Lewis
44

Für eine .txt-Datei des englischen Wörterbuchs können Sie das benutzerdefinierte Wörterbuch verwenden .

Sie können auch einen Listenaspell oder eine Wortliste mit eigenen Einstellungen erstellen .

Sie können auch einen Blick auf http://wordlist.sourceforge.net/ werfen.

Nur englische Wörter: http://www.math.sjsu.edu/~foster/dictionary.txt

Sujith PS
quelle
Während dieser Link die Frage beantworten kann, ist es besser, die wesentlichen Teile der Antwort hier aufzunehmen und den Link als Referenz bereitzustellen. Nur-Link-Antworten können ungültig werden, wenn sich die verknüpfte Seite ändert.
DeanOC
21
@ DeanOC: Ich denke, es ist ziemlich klar, dass die "wesentlichen Teile" eines Wörterbuchs das gesamte Wörterbuch sein würden. Das ist hier nicht praktisch einzufügen. Es ist auch ziemlich klar, was die Verwendung ist: Wörter daraus zu ziehen. Dies ist also in der Tat kein reiner Link. Es ist eine legitime Antwort auf eine Frage, die geschlossen werden sollte (und jetzt ist).
Nathan Tuggy
@NathanTuggy Diese Antwort wurde in der LQP-Warteschlange angezeigt, und ich glaube, dass sie zur Definition einer Nur-Link-Antwort passt. Als Benutzer mit <3K-Repräsentanten hilft meine zu löschende Stimme nur dabei, jemanden darauf aufmerksam zu machen, der dies kann.
DeanOC
1
@ DeanOC: Ich weiß, dass es in LQP erschienen ist. Ich habe aus den angegebenen Gründen auf "OK" geklickt: Grundsätzlich ist "Nur Link" viel subtiler als "Hat ein Link, aber keinen Code oder Zitat? MIT FEUER VERBRENNEN". Beachten Sie, dass eine ausreichende Lösch Auswahl empfehlen auch 2k Benutzer werden Beiträge löschen. (Ich war persönlich dafür verantwortlich, eine Reihe von Posts vom Rand zu kippen.)
Nathan Tuggy
@ NathanTuggy Sie können natürlich frei wählen, wie Sie es für richtig halten. Ich habe für das Löschen gestimmt, da ich in dieser Antwort keinen Wert sehe, wenn der Link veraltet ist.
DeanOC
35

http://www.math.sjsu.edu/~foster/dictionary.txt

350.000 Wörter

Sehr spät, könnte aber für andere nützlich sein.

Rajendra Uppal
quelle
24
Wenn man sich die ersten paar ansieht, sind viele keine regulären englischen Wörter.
Tripleee
8
Dies war sinnlos, da viele einfache Wörter wie Sünde fehlten, in ...
FernandoZ
7
Ja, und hat Wörter wie "wwwwwww". Kein Wort.
Jared Forsyth
1
Achtung, dieser Link stürzt in meinem Firefox ab, weil er versucht, die gesamte Datei zu laden. Ahahahaha
Andrew
@ Andrew stürzt nicht in Chrome 50 ab.
Bogdan M.
11

Es gibt auch WordNet . Das Datendateiformat ist gut dokumentiert.
Ich habe es zum Erstellen einer einbettbaren Wörterbuchbibliothek für iOS-Entwickler ( www.lexicontext.com ) und auch in einer meiner Apps verwendet.

Ori
quelle
2
Jackpot. Wenn jemand nach Wörtern sucht, die seinen Wortarten zugeordnet sind, laden Sie einfach das Hauptpaket von WordNet herunter.
Andrew
10

@ Future-Searchers: Sie können Aspell verwenden , um die Wörterbuchprüfungen durchzuführen. Es enthält Bindungen in Ruby und Python. Es würde Ihre Arbeit viel einfacher machen.

Khaja Minhajuddin
quelle