Ich suche nach einer einfach zu installierenden Text-to-Speech-Software für Ubuntu, die sich natürlich anhört. Ich habe installiert Festival
, Gespeaker
etc., aber nichts klingt sehr natürlich. Alles sehr synthetisch und schwer zu verstehen.
Irgendwelche Empfehlungen da draußen?
software-recommendation
text-to-speech
I Herz Ubuntu
quelle
quelle
Antworten:
SVOX pico2wave
Ein sehr minimalistisches TTS, das besser klingt als Espeak oder Mbrola (meiner Meinung nach). Einige Informationen hier .
Ich verstehe nicht, warum pico2wave im Vergleich zu espeak oder mbrola selten diskutiert wird. Es ist klein, klingt aber sehr gut (natürlich). Ohne Modifikation hören Sie eine natürlich klingende weibliche Stimme.
UND ... im Vergleich zu Mbrola erkennt es Einheiten und spricht es richtig!
Zum Beispiel:
Nach der Installation benutze ich es in einem Skript:
Führen Sie es dann mit dem gewünschten Text aus:
oder lesen Sie den Inhalt einer ganzen Datei:
Das ist alles, um ein leichtes, stabiles TTS auf Ubuntu zu haben.
quelle
pico2wave
ist inlibttspico-utils
neueren Ubuntu-Versionen enthalten. @ CarlosEugenioThompsonPinzóncat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo
pico2wave -w a.wav "$(input.txt)"
=). Stimmen Sie zu, dass diese CLI-Schnittstelle ein schlechtes Design aufweist: Im Gegensatz zu den meisten CLIs kann die maximale CLI- Argumentlänge des Betriebssystems erreicht werden .echo {1..1000}
Sag es!
Ich glaube, ich habe die beste kostenlose TTS-Software mit einer Google Chrome-Erweiterung namens "SpeakIt" gefunden. Dies funktioniert nur im Chrome-Browser für mich unter Ubuntu. Aus irgendeinem Grund funktioniert es nicht mit Chrom. SpeakIt kommt mit zwei weiblichen Stimmen, die beide im Vergleich zu allem anderen sehr realistisch klingen. Mindestens vier weitere männliche und weibliche Stimmen sind in den Chrome-Erweiterungen aufgeführt, wenn Sie im Chrome Web Store nach "TTS" suchen.
Verwendung : Zur Verwendung auf einer Website. Sie markieren den zu lesenden Text und klicken entweder mit der rechten Maustaste und "SpeakIt" oder auf das SpeakIt-Symbol in der oberen Leiste von Chrome.
Firefox-Benutzer haben auch zwei Möglichkeiten. Suchen Sie in Firefox-Addons nach TTS und finden Sie "Click Speak" und "Text to Voice". Die Stimmen sind nicht so gut wie die Chrome SpeakIt-Stimmen, aber definitiv verwendbar.
Die SpeakIt-Erweiterung verwendet die iSpeech-Technologie und für einen Preis von 20 USD pro Jahr kann die Site Text in MP3-Audiodateien konvertieren. Sie können Text, URLs, RSS-Feeds sowie Dokumente wie TXT, DOC und PDF eingeben und in MP3 ausgeben. Sie können Podcasts erstellen, Audiodaten einbetten usw. Hier ist ein Link und ein Beispiel für deren Audio (Sie wissen nicht, wie lange der Link dauern wird).
quelle
Pico und espeak machen Spaß und sind einfach zu arbeiten, aber sie sind nicht so gut. Die voreingestellten Festivalstimmen sind auch nicht so gut. Festival ist jedoch ein auf Schemata basierendes Sprachsystem, in dem eine Reihe von Forschern viel bessere Plug-In-Stimmen entwickelt haben. Sie können die pico2wave-Qualität von Ubuntu auf Lager leicht übertreffen, da eine dieser Stimmen als fertiges Paket erhältlich ist.
Um das Festival natürlich klingen zu lassen, gehen Sie wie folgt vor:
Sie können dies von der Befehlszeile aus tun, indem Sie
-b
(oder--batch
) verwenden und jeden Befehl in einfache Anführungszeichen setzen:Sie können andere sehr gute Stimmen aus dem Nitech-Repository erhalten, aber die Installation ist schwierig, und die Standardpfade wurden geändert, sodass die Dateinamenreferenzen in den mitgelieferten Schemadateien möglicherweise manuell bearbeitet werden müssen, um mit Ubuntu zu arbeiten.
quelle
Einfaches Google ™ TTS
Update von der Projektseite (2019-02) : Dieses Projekt wird derzeit nicht gewartet und wird dies auf absehbare Zeit auch bleiben
Da es keine bessere Alternative gibt, habe ich ein Bash-Skript geschrieben , das mit einem Perl-Skript von Michal Fapso zusammenarbeitet , um TTS über Google Translate bereitzustellen. Aus der Projektbeschreibung:
Die Hauptmerkmale sind:
Installation und Verwendung sind auf der Projektseite dokumentiert .
Ich wäre froh, wenn Sie es versuchen würden. Fehlerberichte und andere Rückmeldungen sind willkommen!
quelle
Ich habe für Ubuntu, das von hoher Qualität ist, nach Text zu Sprache gesucht. Da ist gar nichts. Meine Stimmbänder sind gelähmt, deshalb brauchte ich TTS, um meine Ubuntu-Videos mit Sprachanweisungen zu versehen . Hier können Sie kommerzielle, qualitativ hochwertige Linux-Text-to-Speech-Software erwerben . Es ist nur sehr teuer. Am Ende kaufte ich Natural Reader für Windows (funktioniert in Ubuntu unter Wine nicht) für 40 US-Dollar. Vielleicht bekomme ich später das Linux.
quelle
Ich habe nach dem am besten klingenden und leicht zu stimmenden Text für Sprachstimmen gesucht. Nachstehend finden Sie eine Liste der meiner Meinung nach Top 5-Produkte in der Reihenfolge der Klangqualität. Die meisten mit diesem Produkt verbundenen Websites verfügen über eine interaktive Demo, mit der Sie selbst bestimmen können.
quelle
Ich finde Nitech HTS-Stimmen auf dem Festival sehr natürlich und beruhigend gegenüber allen anderen Stimmen, die ich gehört habe. Unter diesem Link erfahren Sie, wie Sie Nitech und andere Sounds mit festival einrichten. Ich habe keine gute Benutzeroberfläche gefunden, mit der ich diese Stimmen konfigurieren kann, aber die Einstellung über festival.scm funktioniert immer noch. Dieser Beitrag ist sehr alt und Sie können das tatsächliche Installationsverzeichnis mit dem Befehl "locate festival" ermitteln
quelle
Kombinieren Sie SVOX-Tools (Pico) mit LibreOffice:
SVOX (Pico) -Tools sind einfach zu installieren und bringen qualitativ hochwertige Stimmen in Ubuntu. Es installieren:
Sie können LibreOffice in Kombination mit SVOX (pico) -Tools verwenden, indem Sie die Erweiterung "Read Text" installieren, und Sie erhalten eine "GUI" für diese hervorragende TTS-Software:
Richten Sie die Optionen der Read Text Extension mit Extras - Add-Ons - Auswahl lesen ... ein. Verwenden Sie / usr / bin / python als externes Programm. Wählen Sie eine Befehlszeilenoption, die das Token (PICO_READ_TEXT_PY) enthält . Möglicherweise möchten Sie einige davon testen .
Jetzt müssen Sie nur noch Text in LO Writer, Calc, Impress oder Draw auswählen und auf das als Symbolleiste hinzugefügte Symbol (ein fröhliches Gesicht mit einem Ballon) klicken.
quelle
Hier ist, was ich getan habe, um reine natürliche Sprache für PDF- und andere Textdateien zu haben (andere Lösungen sind nicht natürlich oder sie sind nur bezahlte Dienste). Dies ist eigentlich eine Abhilfe mit Chrom oder Chrom, funktioniert aber schnell und einfach.
Es gibt auch Möglichkeiten, andere Dateien wie .doc und .txt in Chrome zu öffnen und das Gleiche zu tun. Es gibt andere Erweiterungen für Chrome, mit denen Sie PDF-Dateien anzeigen und prüfen können, ob sie besser zu Ihnen passen. Außerdem können Sie alle Arten von Texten in Google Drive hochladen und SpeakIt! um es für dich zu lesen. Eine andere Erweiterung namens "Text sprechen" funktioniert auf die gleiche Weise und hat natürliche Sprache.
quelle
Wenn für einen besseren tts Motor der Suche mit dem neuen verwenden Firefox 49 narrativen Modus fand ich pico tts (SVOX) - meinen Liebling Motor TTS.
Wie ändere ich die Standard-Sprachsynthese-Engine systemweit?
Die Leute von Arch Linux haben mich auf den richtigen Weg gebracht:
Deaktivieren Sie das gewünschte Modul und legen Sie es in den Einstellungen für den Sprachverteiler als Standard fest:
Starten Sie den Daemon neu:
ABER, wenn Firefox erneut gestartet wird, passiert nichts. Laut dem obigen Link (Arch Forum Post # 10 und # 16) funktioniert das mit Festival (habe es nicht versucht), aber der Speech-Dispatcher für Pico listet keine verfügbaren Stimmen auf. Es läuft nicht.
Jede Idee da draußen wäre sehr dankbar ;-)
quelle
Mein Lieblings-Text-to-Speech-Programm heißt Magic English, aber wie Natural Reader von Joe Steiger ist es ein Windows-Programm und ich bin mir nicht sicher, ob es unter Wine laufen wird.
AT & T Natural Voices ist online als Demo verfügbar, aber das ist mehr ein Workaround als eine Lösung ...
quelle
Einfaches Google ™ TTS
Pico, Mbrola, Cmu, Festival, Flite, alle saugen im Jahr 2017 (Sie waren erstaunlich in den 90er Jahren). Die natürliche Sprache von AT & T (die fantastisch ist) ist nicht mit Linux kompatibel und auch nicht kostenlos. Deshalb verwenden wir Google
quelle
gTTS
Nachteile : Nur CLI. Müssen online sein, um einen öffentlichen offenen Endpunkt von Google anzufordern.
Verwendungszweck
Dokumentation und weitere Beispiele
Andere
Einige wurden bereits erwähnt
Mimic . Installation:
eSpeak + Gespeaker (GUI) ( Gespeaker-Quellcode )
Nachteile : Alt und hässlich
quelle
Dafür baue ich Intelligent Speaker - Erweiterung für Google Chrome. Es kann Seiten auch ohne Auswahl lesen (wenn die Texterkennung korrekt ist).
quelle