Spracherkennungs-API

7

Gibt es eine Spracherkennungs-API für Ubuntu / Linux? Ich habe ein Schulprojekt und muss die Rede in geschriebenen Text umwandeln. Die Programmiersprache ist kein Problem. Ich habe cmu-sphinx ausprobiert, aber nicht viel Glück damit gehabt, was bedeutet, dass es nicht wirklich viel von meiner definierten Grammatik erkannt hat oder nur Wörter verwechselt hat. Jede Hilfe in dieser Angelegenheit wäre dankbar. Ich habe auch Google durchsucht und konnte nicht wirklich viele Informationen finden.

Romeo Calota
quelle

Antworten:

3

Die beiden wichtigsten Open-Source-Spracherkennungs-Engines in Ubuntu sind Julius und Pocketsphinx. Bei beiden handelt es sich um recht einfache Forschungsprojekte, und Sie müssen viel lesen und experimentieren, um sie verwenden zu können: Es handelt sich nicht um einfache Install-and-Go-Projekte. Simon zuhört, wie oben erwähnt, ist ein einfacher installieren-and-go - Projekt, und das Simon Listens Projekt hat eine spezifische Installation für Ubuntu - http://www.cyber-byte.at/wiki/index.php/Installation# Ubuntu hat Anweisungen zum Aktivieren - aber das funktioniert nur mit 10.04, nicht mit dem kürzlich veröffentlichten 10.10. (Hoffentlich wird das Simon Listens-Projekt bald eine 10.10-Version verfügbar machen.)

sil
quelle
1

Es gibt die Java Speech API, die plattformübergreifend funktioniert ...

chris
quelle
@ Romeo, das heißt, Sie müssen alles codieren. Ich habe cmu-sphinx verwendet, bevor es anständig war. Es funktioniert einfach nicht gut mit Umgebungsgeräuschen.
Myusuf3
Ja, ich habe das untersucht, aber leider hat die Java Speech API keine Engine, sie ist eine Art Wrapper für jede Engine, die Sie bereits installiert haben, so dass sie in Java verwendet werden kann
@gabagecollector: Also, was genau meinst du damit, ich muss alles codieren. Das Problem ist, dass Umgebungsgeräusche unvermeidlich sind. Ich habe ein Headset-Mikrofon verwendet und in einer sehr ruhigen Umgebung getestet.
@ Rome Calota: das stimmt. Eine Liste der Implementierungen finden Sie hier: java.sun.com/products/java-media/speech/forDevelopers/…
chris
1

Schauen Sie sich auch Simon Listens an, der die Open-Source-CSR-Engine Julius für große Vokabeln verwendet.

zerwas
quelle
Danke, ich werde in Julius schauen :)