Ich versuche zu verstehen , wie mein iPhone kann für mich immer wieder hören zu sagen Hey Siri
, Alexa
, Hey Cortana
oder Okay Google
ohne meine Batterie schnell Entleerung nach unten.
Ich stellte mir zwei Arten von Algorithmen vor. Eine, die Zeitscheiben wie 10 ms breite Scheiben alle 200 ms aufzeichnet und eine synchrone Erkennung auf bestimmten Frequenzen durchführt. Diese Parameter hängen jedoch stark von der Charakteristik meiner Stimme ab. Darüber hinaus wird es immer noch viel CPU-Leistung verbrauchen, um ständig zu versuchen, eine Hey Siri
mitten im Nirgendwo zu finden.
Welche Art von effizientem Algorithmus / Implementierung mit geringem Stromverbrauch (Hardware oder Software) kann eine solche Aufgabe ausführen?
Dies hängt irgendwie mit diesem Patent zusammen, denke ich: https://www.google.com/patents/US20160253997
Ich habe einige Artikel gelesen, die sich mit versteckten Markov-Modellen befassen, aber ich bezweifle, dass es sich um einen Ansatz mit sehr geringem Stromverbrauch handelt.
quelle