Kommerzielles Befehlszeilenprogramm zum Übertragen von Sprachnotizen in Text?

5

Ich suche ein kommerzielles Befehlszeilenprogramm, um meine MP3-Sprachnotizen in Textdateien zu übertragen. Mein Arbeitsablauf besteht darin, Sprachnotizen den ganzen Tag über aufzuzeichnen und diese Notizen als MP3-Dateien in Dropbox hochzuladen. Ich möchte diese MP3-Dateien stapelweise in äquivalente TXT-Dateien konvertieren. Meine Sprachnotizen reichen von <1 Minute bis maximal ~ 10 Minuten.

Ich habe versucht, Dragon Dictate 4 für Mac zu verwenden, und fand diese Anwendung ein Albtraum und sehr unzuverlässig. Ich würde gerne eine abgespeckte Version dieser Anwendung erwerben, die nur Audiodateien transkribiert, aber ich kann ein solches Produkt nicht auf der Nuance-Website finden. Leider konnte diese Anwendung nicht zuverlässig genug funktionieren, um nach einer API oder einer Skriptschnittstelle zu suchen ... und ich bin ein wenig skittisch über diesen Anbieter, nachdem ich ähnliche Erfahrungen von anderen Benutzern gelesen habe.

Ich habe mir auch Cloud-Dienste angesehen, aber die, die ich gefunden habe, scheinen ziemlich teuer zu sein - 0,20 USD / Minute und mit Einschränkungen hinsichtlich der maximalen Größe der Audiodatei, die hochgeladen werden kann.

Brett Bond
quelle

Antworten:

4

Ich bezweifle, dass Sie eine kommerzielle Befehlszeilenanwendung finden können.

Sie können besser eine Open-Source-Bibliothek wie pocketsphinx http://cmusphinx.sourceforge.net verwenden

Um eine Datei zu transkribieren, können Sie die neueste Version 5prealpha verwenden:

   ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav
   pocketsphinx_continuous -infile file.wav -logfn /dev/null

das sollte Ihnen eine automatisierte Transkription geben. Um die Genauigkeit zu erhöhen, können Sie sich an Ihre eigene Stimme anpassen.

Nikolay Shmyrev
quelle
1
Diese Qualität ist ziemlich schlecht.
Chovy