Wie erhalte ich eine Sprachausgabe aus dem eingegebenen Text über die Befehlszeile?
Auch die Möglichkeit, Sprachrate, Tonhöhe, Lautstärke usw. mit einem einfachen Befehl zu ändern .
Wie erhalte ich eine Sprachausgabe aus dem eingegebenen Text über die Befehlszeile?
Auch die Möglichkeit, Sprachrate, Tonhöhe, Lautstärke usw. mit einem einfachen Befehl zu ändern .
Antworten:
In absteigender Reihenfolge der Popularität :
say konvertiert Text mithilfe der GNUstep-Sprachmaschine in hörbare Sprache.
Festival Allgemeines mehrsprachiges Sprachsynthesesystem.
spd-say sendet eine Text-zu-Sprache-Ausgabeanforderung an den Speech-Dispatcher
espeak ist ein mehrsprachiger Software-Sprachsynthesizer.
quelle
spd-say
sudo pip install gTTS
(Google Text to Speech / github.com/pndurette/gTTS )gtts-cli "hello" -o hello.mp3
können Sie esmpg123 -
auch weiterleiten .gtts-cli "why, hello there" | mpg123 -
.spd-say
scheint nicht in der Lage zu sein, tts gleichzeitig zu spielen, nur einmalespeak
/spd-say
ist das Beste für Meme (die anderen können das Wort "meme" nicht einmal richtig aussprechen). Am besten kann ich sagen,spd-say
verwendetespeak
als Backend (die Stimmen klingen gleich).espeak
ist ein schönes kleines Werkzeug.Ich spiele einfach gerne in einer Befehlszeile damit herum. Möglicherweise liegt ein Konflikt mit Pulseaudio vor, daher verwende ich eine langwierige Version, die es nicht erforderlich macht, sie ordnungsgemäß einzurichten.
espeak --help
zeigt Ihnen die Optionen zum Kalibrieren von Lesegeschwindigkeit, Tonhöhe, Stimme usw.Wenn Sie Ihre Notizen machen, speichern Sie sie als Textdatei und dann:
Sie können dann mit ffmeg et al herumspielen, um dies von PCM auf etwas besser handhabbares wie MP3 oder OGG zu komprimieren. Aber das ist eine andere Geschichte.
quelle
Von
man spd-say
:Daher können Sie Text-to-Speech erhalten, indem Sie folgenden Befehl ausführen:
Ex:
Sie können auch Sprachrate, Tonhöhe, Lautstärke usw. einstellen ( siehe Manpage).
quelle
spd-say -t female2 "text"
macht es erträglichMbrola funktioniert nicht seit dem 11.10.
SVOX (pico) -Tools sind einfach zu installieren, leicht zu verwenden und bieten eine gute Sprachqualität in Ubuntu. Es installieren:
Noch einfacher ist es, LibreOffice in Kombination mit SVOX (pico) -Tools zu verwenden, indem Sie die Erweiterung "Read Text" installieren und eine "GUI" für diese hervorragende TTS-Software erhalten:
Richten Sie die Optionen der Read Text Extension mit Extras - Add-Ons - Auswahl lesen ... ein. Verwenden Sie / usr / bin / python als externes Programm. Wählen Sie eine Befehlszeilenoption mit dem Token (PICO_READ_TEXT_PY).
quelle
Python Google Speach:
Svox Von Android:
Svox Nanotts:
Links - Wiki:
Vergleich von Sprachsynthesizern
quelle
google_speech
auf Ubuntu 18.04 zu installieren und zu verwenden, musste ich installierenpython3-pip
undlibsox-fmt-mp3
und verwendenpip3 install google_speech
.Und noch ein weiterer espeak gui:
gespeaker
. Es verwendet beideespeak
undmbrola
Motoren. Es hat auch mehr Optionen alsespeak-gui
.quelle
Das Folgende ist keine FLOSS-Lösung, aber Sie finden es möglicherweise lohnenswert. (es ist eine Wein - Lösung),
Ich persönlich bin sehr an TTS interessiert, ich benutze es ziemlich oft ... zB. Hören Sie sich einen abwechslungsreichen Diskurs an, bei dem ich nie die Mühe machen würde, mich an andere zu halten (weil ich noch eine Tasse Kaffee brauche ... :)
Ein paar Dinge, die ich auf dem Weg entdeckt habe ... oder sollte ich sagen, Dinge, die ich auf dem Weg nicht entdeckt habe ... Um es klar auszudrücken: Jedes Stück FOSS TTS- Sprachsoftware, das ich ausprobiert habe, ist unterdurchschnittlich und daher ungeeignet für langatmiges Hören ...
Ich benutze derzeit ATnT's NaturalVoices. Es ist nur für Windows (vielleicht den Mac) verfügbar, läuft aber unter
wine
Ubuntu. (Es hat eine kleine Glytch, wo ich manchmal auf das Panel klicken muss, wenn ich mich vom Reader entferne ... Es ist eine kleine Glytch Problem im Vergleich zum Vorteil der Sprachqualität von NatualVoices.Einige andere Dinge, die ich für ein halbwegs vernünftiges Hörerlebnis als praktisch unerlässlich empfunden habe, sind:
Diese TTS-Programme sind nicht intelligent (na ja, vielleicht so intelligent wie ein junger Pavian). Deshalb brauchen sie jede Hilfe, die sie bekommen können. und es gibt ein (und nur ein Reader- Programm, das ich gefunden habe und das dabei sehr
ReadPlease (2003 Pro)
hilfreich ist. Die App heißt ... Sie können Wörter und Wortgruppen so ändern, dass sie ausgesprochen werden, wie Sie es möchten ist keineswegs perfekt, aber für mich hat es den Unterschied gemacht, ob der gesamte Prozess nutzbar oder nicht nutzbar ist ...Die Sprache in Natural Voices ist "okay", aber es ist ein bisschen langweilig. Es gibt auch andere gute Produkte, aber sie sind alle leider für Windows).
Es infiziert manchmal überraschend gut. Aber OMG, anfangs ist es ein Schmerz! .. so ist # 2 * Geduld ... und viele Aktualisierungen Ihrer "Spezialwörter" -Liste ... Mit Geduld meine ich, dass Sie (ich) sich tatsächlich an die Sprachmuster meines Pavians gewöhnt haben:) ... und durch Übrigens habe ich derzeit ungefähr 3000 Wörter, die jetzt "menschlich" genug klingen, dass ich nicht mehr zusammenzucke, wenn ich sie höre.
3 .. "Follow the Bouncing Ball" ... Da die Stimme nie so gut ist wie die eines echten Sprechers, müssen die Dinge manchmal geklärt werden. Das Reader-Programm, das ich verwende, hat eine Funktion, für die ich mich sogar mit seiner klobig aussehenden Oberfläche zufrieden gegeben habe Mitte des Bildschirms. Dies ist von unschätzbarem Wert, wenn Sie vor und zurück sehen und schnell nachlesen möchten, was Sie gerade verpasst haben (daher ist es gut, die aktuelle Linie automatisch zu zentrieren).
Nun, das ist meine Erfahrung. Ich mache jetzt einen Kaffee, und während ich das mache, höre ich mir das an, um zu sehen, wie es "liest". TTS ist überraschend gut zum Abholen Tippfehler (ich mache viele Tippfehler) ...
Wenn etwas so Gutes wie ATnT NaturalVoices im Ubuntu-Repository auftaucht, werde ich es versuchen.
Hier ist ein Link zu einigen Beispielen von Natural Voices : Ich benutze "MIke"
quelle
SVOX pico2wave
das ist was ich benutze. Und es klingt natürlich, es ist leicht zu verstehen, es erkennt Einheiten (m, ° C, kg, ...)
Hier ist mein erster Beitrag zu pico2wave
Natürlich klingender Text zu Sprache?
Alles was du tun musst, ist:
Gehen Sie zum Ubuntu Software Center und suchen Sie nach "pico". Sie finden 4 oder 5 Einträge mit "Small Footprint Ling ...". Installieren Sie sie.
Eine mögliche Verwendung von pico2wave ist in meinem ersten Posting beschrieben (folgen Sie dem obigen Link).
Tschüss
quelle
Für
festival
(die Stimme scheint mir natürlicher zu sein):sudo apt-get install festival
echo "hello" | festival --tts
Pitch- und Speed-Konfiguration:
erstellen
~/.festivalrc
:(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100") (Parameter.set 'Audio_Method 'Audio_Command)
Siehe auch http://www.solomonson.com/content/ubuntu-linux-text-speech
Update: auf einem anderen Ubuntu-Computer ausprobiert. Musste Englisch Sprachmodul Paket installieren, um mit Festival richtig zu arbeiten:
sudo apt-get install festvox-kallpc16k
play
Ist auch ein cli Befehl, der mitsox
Paket kommt:sudo apt-get install sox
quelle
Obwohl Sie bereits eine Antwort angenommen haben, wollte ich erwähnen
festival
, was mir auch sehr gefällt. Dieser Beitrag in den Ubuntu-Foren enthält viele Informationen darüber, wie Sie sehr nette Stimmen dafür einrichten können.quelle
Meet
espeak-ng
- Ein mehrsprachiger Software-Sprachsynthesizer:Es wird eine englische Standardstimme verwendet, es gibt jedoch zahlreiche andere Stimmen für andere Sprachen und sogar Dialekte, die mit
espeak-ng --voices
(für alle) oder z. B.espeak-ng --voices=en
(für Englisch) aufgelistet werden können . Sie können-v
zusammen mit der Sprachabkürzung oder dem Dateinamen festgelegt werden, z. B. für Schottisch oder Suaheli:Es gibt viele andere Optionen, z. B.
-s
für die Geschwindigkeit und-w
zum Schreiben der Ausgabe in eine Wave-Datei, siehe die unten verlinkte Manpage.Weitere Lektüre
man espeak-ng
espeak-ng
("Ng" für "next generation") ist ein aktiv entwickelter Zweig der ursprünglichenespeak
Sprachsynthesizer-Software , siehe das Kapitel "History" auf Wikipedia . Beide sind aus den offiziellen Quellen über das Paketespeak
bzw.espeak-ng
erhältlich.quelle
Balabolka under Wine funktioniert (für mich) mit SAPI4-Stimmen (SAPI5-Stimmen werden auf meinem Linux-System nicht erkannt). Es kann Dateien öffnen und mit dem Lesen beginnen.
Hier ist der Link zum AppDB-Eintrag von wine für Balabolka: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859
quelle
Das Tool gTTS eignet sich hervorragend zum Generieren von Audiodateien aus Text. Es verwendet die Text-to-Speech-API von Google Translate und generiert MP3-Dateien.
Da es
pip
für die Installation verwendet wird, empfehle ich dringend, Miniconda zu installieren und anschließendconda
eine Umgebung zu erstellen, in der Sie gTTS installieren können. Sie können Miniconda hier herunterladen:https://docs.conda.io/en/latest/miniconda.html
Das GitHub-Repository für gTTS ist:
https://github.com/pndurette/gTTS
Und die Dokumentation von gTTS finden Sie hier:
https://gtts.readthedocs.io/en/latest/
quelle