Sprachsynthese, die sehr wenig CPU-Leistung erfordert?

13

Zu Zeiten von 8-Bit-PCs mit 1-MHz-CPU (Apple II, Atari 800 usw.) gab es Softwareprogramme, die auf diesen PCs eine nachvollziehbare willkürliche Text-zu-Sprache-Synthese durchführen konnten. Welche veröffentlichten Sprachsynthesealgorithmen könnten für die Implementierung auf Mikrocontrollern mit ähnlich eingeschränkter Leistung und ähnlich begrenztem Speicher geeignet sein? (Wenn überhaupt...)

hotpaw2
quelle
Ich weiß nicht, wie sie das gemacht haben, aber hier ist ein Allophon-zu-Audio-IC namens SpeakerJet und hier der zugehörige Text-zu-Allophon-Generator. Sie könnten die Leute auf speakjet.com fragen, wie sie es gemacht haben ...
Kevin Vermeer
@ KevinVermeer - Warum hast du das nicht als Antwort gepostet? Sie hätten zumindest eine Gegenstimme von mir erhalten, da dies eine hervorragende Ergänzung zu meiner eigenen Antwort wäre.
Mark Booth

Antworten:

3

Die Methoden, mit denen ich in den 80er Jahren auf 8-Bit-Heimcomputern gespielt habe, beinhalteten eine kleine Menge von phonetischen Samples und dann die Definition des zu sprechenden Texts anhand dieser Samples.

Da ich zu diesem Zeitpunkt noch nichts über IPA wusste , habe ich nur zwei Töne pro Buchstabe verwendet und den kurzen Ton Kleinbuchstaben und den langen Tönen Großbuchstaben zugewiesen. Dies hat allerdings einige Lücken hinterlassen, o für / ɒ / ( heiß ) und O für / oʊ / ( offen ) waren einfach, aber / uː / (der oo- Ton im Mond ) konnte in meinem System nicht dargestellt werden, was war ein Problem für mich, da mein Name (/ BUD / Reime mit / SMUD /, versuchen , sie in itinerarium s Phonemsynthese Webseite).

Heutzutage könnte man viel schlaueres tun. Zunächst könnten Sie Nachschlagetechniken verwenden, um bekannte Wörter in orthografischem Text in Ihre bekannten phonetischen Symbole zu übersetzen, und für unbekannte Wörter sollte die Implementierung von Phonics als Algorithmus einen vernünftigen Job leisten.

Nachdem Sie Ihren Phonetik-Stream erhalten haben, können Sie wahrscheinlich DMA- Techniken verwenden, um einzelne Phonem- Samples aus dem Speicher zu Ihrem DAC zu streamen , wobei der Overhead für Ihre CPU geringer ist.

Mark Booth
quelle