Ich suche ein sprecherunabhängiges Programm (kommerziell oder kostenlos), mit dem ich MP3-Dateien mit Sprachaufzeichnungen (insbesondere Podcasts) in Text umwandeln kann. Ich wollte Dragon Naturally Speaking ausprobieren, aber es scheint, dass es nur das Transkribieren meiner eigenen Sprachaufnahmen unterstützt. Also, was sind die Alternativen?
16
Antworten:
Dragon Naturally Speaking importiert MP3-Dateien und versucht, sie zu transkribieren. Es zieht es vor, die Spracherkennung auf den einzelnen Sprecher abzustimmen, leistet aber einen fairen Job, ohne ihn abzustimmen. Es würde wahrscheinlich am besten funktionieren, wenn Ihre Podcast-Lautsprecher wie Tom Brokaw klingen.
quelle
Eine mögliche Lösung wäre, dein Video auf Youtube hochzuladen und die automatischen Untertitel zu testen, die du aktivieren kannst. Es ist noch nicht zu genau, aber du kannst die Untertiteldatei herunterladen und sie selbst bearbeiten, wenn das hilft Bei Urheberrechts- / Pirateriethemen für den Song können Sie das Video in Ihrem Profil als privat kennzeichnen, wenn dies überhaupt möglich ist.
quelle
Ich würde davor warnen, Dragon Naturally Speaking zu testen. Ich habe einige Skripte auf meinem iPhone mit Jailbreak geschrieben, um alle Voicemail-Dateien von meinem Telefon in einen Ordner auf meinem PC zu kopieren / konvertieren, und den Transkriptionsdienst von Dragon Naturally Speaking ausführen lassen.
Das Ergebnis der Transkription für Dateien mit verschiedenen Lautsprechern war absolut unbrauchbar. Ich habe einige der Open-Source-Alternativen ausprobiert, aber die sprecherunabhängige Spracherkennung scheint immer noch auf sehr kleine Wörterbücher beschränkt zu sein.
quelle
Ich benutze http://www.voicebase.com mit Podcast und Videos auf Englisch und es funktioniert sehr gut. Es ist 50 Stunden lang kostenlos.
Sie können die Audiotranskription auf RTF, SRT oder PDF herunterladen.
Sie können Maschinentranskriptionen ca. 10-15 Minuten nach dem Hochladen und manchmal auch frühzeitig herunterladen.
quelle
Open Source: CMU Sphinx
Shareware: http://www.e-speaking.com/ (Windows)
Werbung: Dragon NaturallySpeaking (Windows)
Sie können diese Methode auch ausprobieren, wenn Sie mit osx arbeiten, was mit Audacity und Soundflower möglich ist
Sie könnten auch einige relevante Links für opensource finden, eine andere Shareware, die es wert ist, ausprobiert zu werden, war voxcribecc
Wenn Sie ein .NET-Programmierer sind, können Sie mit dieser Methode Ihr eigenes Kit erstellen
quelle
Podzinger wäre eine großartige Lösung, aber ich bin mir nicht sicher, ob die Rampe (der neue Name für das Unternehmen, das früher EveryZing war und Podzinger produzierte) den Service nicht mehr kostenlos anbietet ...
http://en.wikipedia.org/wiki/Podzinger
quelle