Als «speech-recognition» getaggte Fragen

Spracherkennung ist der Prozess der Umwandlung des gesprochenen Wortes in Text, normalerweise ohne Rücksicht auf einen bestimmten Sprecher (der üblicherweise als "Spracherkennung" bezeichnet wird).

17
menschliches Sprachrauschen Filter

Kennt jemand einen Filter, um Nicht-Sprache zu dämpfen? Ich schreibe Spracherkennungssoftware und möchte alles außer menschlicher Sprache herausfiltern. Dazu gehören Hintergrundgeräusche, Geräusche, die von einem beschissenen Mikrofon erzeugt werden, oder sogar Hintergrundmusik. Ich habe bereits...

10
Wie unterscheidet sich die Geräuschreduzierung für die Spracherkennung von der Geräuschreduzierung, die die Sprache für den Menschen „verständlicher“ machen soll?

Diese Frage interessiert mich schon seit einiger Zeit, vor allem, weil ich selbst an der Rauschunterdrückung für ein vorhandenes Spracherkennungssystem arbeite. Die meisten Artikel über Geräuschreduzierungstechniken scheinen sich darauf zu konzentrieren, wie Sprache für Menschen verständlicher...

9
So implementieren Sie eine gradientenbasierte Hough-Transformation

Ich versuche, die Hough-Transformation für die Kantenerkennung zu verwenden, und möchte Gradientenbilder als Basis verwenden. Was ich bisher das Bild gegeben getan haben , Ivon ihrer Größe [M,N]und ihrer partiellen Ableitungen gx, gyist der Steigungswinkel in jedem Pixel zu berechnen thetas =...

8
Woran erkennt Siri, dass ich "Hey Siri" sage?

Ich versuche zu verstehen , wie mein iPhone kann für mich immer wieder hören zu sagen Hey Siri, Alexa, Hey Cortanaoder Okay Googleohne meine Batterie schnell Entleerung nach unten. Ich stellte mir zwei Arten von Algorithmen vor. Eine, die Zeitscheiben wie 10 ms breite Scheiben alle 200 ms...