Wie erfolgt die Ausgabe von Text in Sprache über die Befehlszeile?

Antworten:

125

In absteigender Reihenfolge der Popularität :

  • say konvertiert Text mithilfe der GNUstep-Sprachmaschine in hörbare Sprache.

    sudo apt-get install gnustep-gui-runtime
    say "hello"
    
  • Festival Allgemeines mehrsprachiges Sprachsynthesesystem.

    sudo apt-get install festival
    echo "hello" | festival --tts
    
  • spd-say sendet eine Text-zu-Sprache-Ausgabeanforderung an den Speech-Dispatcher

    sudo apt-get install speech-dispatcher
    spd-say "hello"
    
  • espeak ist ein mehrsprachiger Software-Sprachsynthesizer.

    sudo apt-get install espeak
    espeak "hello"
    
Sylvain Pineau
quelle
13
spd-say
Scheint ab
3
Außerdem sudo pip install gTTS(Google Text to Speech / github.com/pndurette/gTTS ) gtts-cli "hello" -o hello.mp3können Sie es mpg123 -auch weiterleiten . gtts-cli "why, hello there" | mpg123 -.
Elijah Lynn
Leider spd-sayscheint nicht in der Lage zu sein, tts gleichzeitig zu spielen, nur einmal
phil294
@ ElijahLynn funktioniert nicht
Dims
espeak/ spd-sayist das Beste für Meme (die anderen können das Wort "meme" nicht einmal richtig aussprechen). Am besten kann ich sagen, spd-sayverwendet espeakals Backend (die Stimmen klingen gleich).
QwertyChouskie
18

espeak ist ein schönes kleines Werkzeug.

Ich spiele einfach gerne in einer Befehlszeile damit herum. Möglicherweise liegt ein Konflikt mit Pulseaudio vor, daher verwende ich eine langwierige Version, die es nicht erforderlich macht, sie ordnungsgemäß einzurichten.

sudo apt-get install espeak
espeak --stdout "this is a test" | paplay

espeak --help zeigt Ihnen die Optionen zum Kalibrieren von Lesegeschwindigkeit, Tonhöhe, Stimme usw.

Wenn Sie Ihre Notizen machen, speichern Sie sie als Textdatei und dann:

echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"

Sie können dann mit ffmeg et al herumspielen, um dies von PCM auf etwas besser handhabbares wie MP3 oder OGG zu komprimieren. Aber das ist eine andere Geschichte.

Oli
quelle
1
Sehr schön, man kann auch die grafische Benutzeroberfläche ausprobieren, um zu espeak, espeak-gui.
Sabacon
14

Von man spd-say:

NAME
       spd-say - Sendet eine Text-zu-Sprache-Ausgabeanforderung an den Sprachverteiler

ZUSAMMENFASSUNG
       spd-say [Optionen] "etwas Text"

BESCHREIBUNG
       spd-say sendet eine Text-zu-Sprache-Ausgabeanforderung an den Speech-Dispatcher-Prozess, der diese verarbeitet und das Ergebnis idealerweise ausgibt
       zum Audiosystem.

OPTIONEN
       -r, --rate
              Legen Sie die Sprechgeschwindigkeit fest (zwischen -100 und +100, Standard: 0)

       -p, --pitch
              Stellen Sie die Tonhöhe der Rede ein (zwischen -100 und +100, Standard: 0)

       -i, --Volumen
              Stellen Sie die Lautstärke (Intensität) der Rede ein (zwischen -100 und +100, Standard: 0)

Daher können Sie Text-to-Speech erhalten, indem Sie folgenden Befehl ausführen:

spd-say "<type text>"

Ex:

spd-say "Welcome to Ubuntu Linux"

Sie können auch Sprachrate, Tonhöhe, Lautstärke usw. einstellen ( siehe Manpage).

Pandya
quelle
3
spd-say -t female2 "text"macht es erträglich
scorpiodawg
6

Mbrola funktioniert nicht seit dem 11.10.

SVOX (pico) -Tools sind einfach zu installieren, leicht zu verwenden und bieten eine gute Sprachqualität in Ubuntu. Es installieren:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Noch einfacher ist es, LibreOffice in Kombination mit SVOX (pico) -Tools zu verwenden, indem Sie die Erweiterung "Read Text" installieren und eine "GUI" für diese hervorragende TTS-Software erhalten:

Richten Sie die Optionen der Read Text Extension mit Extras - Add-Ons - Auswahl lesen ... ein. Verwenden Sie / usr / bin / python als externes Programm. Wählen Sie eine Befehlszeilenoption mit dem Token (PICO_READ_TEXT_PY).

leoperbo
quelle
4

Python Google Speach:

pip install google_speech

google_speech "Test the hello world"

Svox Von Android:

apt-get install svox-pico

pico2wave --wave=test.wav "Test the hello world"
play test.wav

Svox Nanotts:

git clone https://github.com/gmn/nanotts.git
cd nanotts
make

./nanotts -v en-US "Test the hello world"

Links - Wiki:

Vergleich von Sprachsynthesizern

intika
quelle
1
Um google_speechauf Ubuntu 18.04 zu installieren und zu verwenden, musste ich installieren python3-pipund libsox-fmt-mp3und verwenden pip3 install google_speech.
Artm
3

Und noch ein weiterer espeak gui: gespeaker. Es verwendet beide espeakund mbrolaMotoren. Es hat auch mehr Optionen als espeak-gui.

luri
quelle
3

Das Folgende ist keine FLOSS-Lösung, aber Sie finden es möglicherweise lohnenswert. (es ist eine Wein - Lösung),

Ich persönlich bin sehr an TTS interessiert, ich benutze es ziemlich oft ... zB. Hören Sie sich einen abwechslungsreichen Diskurs an, bei dem ich nie die Mühe machen würde, mich an andere zu halten (weil ich noch eine Tasse Kaffee brauche ... :)

Ein paar Dinge, die ich auf dem Weg entdeckt habe ... oder sollte ich sagen, Dinge, die ich auf dem Weg nicht entdeckt habe ... Um es klar auszudrücken: Jedes Stück FOSS TTS- Sprachsoftware, das ich ausprobiert habe, ist unterdurchschnittlich und daher ungeeignet für langatmiges Hören ...

Ich benutze derzeit ATnT's NaturalVoices. Es ist nur für Windows (vielleicht den Mac) verfügbar, läuft aber unter wineUbuntu. (Es hat eine kleine Glytch, wo ich manchmal auf das Panel klicken muss, wenn ich mich vom Reader entferne ... Es ist eine kleine Glytch Problem im Vergleich zum Vorteil der Sprachqualität von NatualVoices.

Einige andere Dinge, die ich für ein halbwegs vernünftiges Hörerlebnis als praktisch unerlässlich empfunden habe, sind:

  1. Diese TTS-Programme sind nicht intelligent (na ja, vielleicht so intelligent wie ein junger Pavian). Deshalb brauchen sie jede Hilfe, die sie bekommen können. und es gibt ein (und nur ein Reader- Programm, das ich gefunden habe und das dabei sehr ReadPlease (2003 Pro)hilfreich ist. Die App heißt ... Sie können Wörter und Wortgruppen so ändern, dass sie ausgesprochen werden, wie Sie es möchten ist keineswegs perfekt, aber für mich hat es den Unterschied gemacht, ob der gesamte Prozess nutzbar oder nicht nutzbar ist ...

  2. Die Sprache in Natural Voices ist "okay", aber es ist ein bisschen langweilig. Es gibt auch andere gute Produkte, aber sie sind alle leider für Windows).
    Es infiziert manchmal überraschend gut. Aber OMG, anfangs ist es ein Schmerz! .. so ist # 2 * Geduld ... und viele Aktualisierungen Ihrer "Spezialwörter" -Liste ... Mit Geduld meine ich, dass Sie (ich) sich tatsächlich an die Sprachmuster meines Pavians gewöhnt haben:) ... und durch Übrigens habe ich derzeit ungefähr 3000 Wörter, die jetzt "menschlich" genug klingen, dass ich nicht mehr zusammenzucke, wenn ich sie höre.

    3 .. "Follow the Bouncing Ball" ... Da die Stimme nie so gut ist wie die eines echten Sprechers, müssen die Dinge manchmal geklärt werden. Das Reader-Programm, das ich verwende, hat eine Funktion, für die ich mich sogar mit seiner klobig aussehenden Oberfläche zufrieden gegeben habe Mitte des Bildschirms. Dies ist von unschätzbarem Wert, wenn Sie vor und zurück sehen und schnell nachlesen möchten, was Sie gerade verpasst haben (daher ist es gut, die aktuelle Linie automatisch zu zentrieren).

Nun, das ist meine Erfahrung. Ich mache jetzt einen Kaffee, und während ich das mache, höre ich mir das an, um zu sehen, wie es "liest". TTS ist überraschend gut zum Abholen Tippfehler (ich mache viele Tippfehler) ...

Wenn etwas so Gutes wie ATnT NaturalVoices im Ubuntu-Repository auftaucht, werde ich es versuchen.

Hier ist ein Link zu einigen Beispielen von Natural Voices : Ich benutze "MIke"

Peter.O
quelle
3

SVOX pico2wave

das ist was ich benutze. Und es klingt natürlich, es ist leicht zu verstehen, es erkennt Einheiten (m, ° C, kg, ...)

Hier ist mein erster Beitrag zu pico2wave

Natürlich klingender Text zu Sprache?

Alles was du tun musst, ist:

Gehen Sie zum Ubuntu Software Center und suchen Sie nach "pico". Sie finden 4 oder 5 Einträge mit "Small Footprint Ling ...". Installieren Sie sie.

Eine mögliche Verwendung von pico2wave ist in meinem ersten Posting beschrieben (folgen Sie dem obigen Link).

Tschüss

user85321
quelle
Ich habe Ihre Art und Weise können Sie pls sagen Sie mir , wie man eine naturl süße weibliche Stimme mit Ihrer Art und Weise verwendet
user49557
3

Für festival(die Stimme scheint mir natürlicher zu sein):

sudo apt-get install festival

echo "hello" | festival --tts

Pitch- und Speed-Konfiguration:

erstellen ~/.festivalrc:

(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100") (Parameter.set 'Audio_Method 'Audio_Command)

Siehe auch http://www.solomonson.com/content/ubuntu-linux-text-speech

Update: auf einem anderen Ubuntu-Computer ausprobiert. Musste Englisch Sprachmodul Paket installieren, um mit Festival richtig zu arbeiten:

sudo apt-get install festvox-kallpc16k

playIst auch ein cli Befehl, der mit soxPaket kommt:

sudo apt-get install sox

d9k
quelle
2

Obwohl Sie bereits eine Antwort angenommen haben, wollte ich erwähnen festival, was mir auch sehr gefällt. Dieser Beitrag in den Ubuntu-Foren enthält viele Informationen darüber, wie Sie sehr nette Stimmen dafür einrichten können.

schäbig
quelle
2

Meet espeak-ng- Ein mehrsprachiger Software-Sprachsynthesizer:

espeak-ng "text to read"
espeak-ng -f "~/file to read"

Es wird eine englische Standardstimme verwendet, es gibt jedoch zahlreiche andere Stimmen für andere Sprachen und sogar Dialekte, die mit espeak-ng --voices(für alle) oder z. B. espeak-ng --voices=en(für Englisch) aufgelistet werden können . Sie können -vzusammen mit der Sprachabkürzung oder dem Dateinamen festgelegt werden, z. B. für Schottisch oder Suaheli:

espeak-ng -v en-gb-scotland "text to read" # language name
espeak-ng -v bnt/sw "text to read" # file name: “bnt” for Bantu, “sw” for Swahili

Es gibt viele andere Optionen, z. B. -sfür die Geschwindigkeit und -wzum Schreiben der Ausgabe in eine Wave-Datei, siehe die unten verlinkte Manpage.

Weitere Lektüre

espeak-ng("Ng" für "next generation") ist ein aktiv entwickelter Zweig der ursprünglichen espeakSprachsynthesizer-Software , siehe das Kapitel "History" auf Wikipedia . Beide sind aus den offiziellen Quellen über das Paket espeakbzw. espeak-ngerhältlich.

Dessert
quelle
0

Balabolka under Wine funktioniert (für mich) mit SAPI4-Stimmen (SAPI5-Stimmen werden auf meinem Linux-System nicht erkannt). Es kann Dateien öffnen und mit dem Lesen beginnen.

Hier ist der Link zum AppDB-Eintrag von wine für Balabolka: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859

Hemantkumar Garach
quelle
0

Das Tool gTTS eignet sich hervorragend zum Generieren von Audiodateien aus Text. Es verwendet die Text-to-Speech-API von Google Translate und generiert MP3-Dateien.
Da es pipfür die Installation verwendet wird, empfehle ich dringend, Miniconda zu installieren und anschließend condaeine Umgebung zu erstellen, in der Sie gTTS installieren können. Sie können Miniconda hier herunterladen:

https://docs.conda.io/en/latest/miniconda.html

Das GitHub-Repository für gTTS ist:

https://github.com/pndurette/gTTS

Und die Dokumentation von gTTS finden Sie hier:

https://gtts.readthedocs.io/en/latest/

evaristegd
quelle