Ich habe eine Situation, in der ich eine große MP3-Datei habe, die die Ausgabe eines Journalisten-Aufnahmegeräts ist. Dieses Gerät läuft lange, da ich vergesse, Aufnahmetasten zu drücken, wenn ich mit Personen auf der Website spreche, von denen ich Berichte erhalte Zwischenfälle etc ..
Im Grunde genommen habe ich eine 11-stündige MP3-Datei und derzeit analysiere ich sie, um die Aufnahmen zu finden, die ich gemacht habe. Dies dauert einige Stunden 4-5 Stunden.
Gibt es eine Möglichkeit?
1. Um die Sprachaufzeichnungen allein aus dieser Datei zu erhalten.
2. Beseitigen oder verringern Sie die Lautstärke des Verkehrs oder anderer Hintergrundgeräusche wie Maschinengeräusche usw., sodass nur Sprachgeräusche aus der MP3- Datei extrahiert werden.
Ich bin mir nicht sicher, ob dies möglich ist
Vielen Dank
Antworten:
Um von Anfang an klar zu sein: Es ist eine sehr komplizierte Aufgabe, Audioaufnahmen automatisch zu analysieren. Der Versuch, zwischen Sprache und Lärm zu unterscheiden, ist theoretisch möglich, aber ich bezweifle, dass es im Internet eine Ein-Klick-Lösung gibt. Das klingt eher nach Forschungsarbeit.
Außerdem wird Ihre Aufnahme wahrscheinlich keine Passagen mit völliger Stille enthalten. Wäre dies der Fall, könnte man die Datei an den Stellen aufteilen, an denen absolut kein Ton zu hören ist. Dies erfordert auch einige Programmierungen. Ich kann mich an kein Programm erinnern, das dies tut.
Suche nach wichtigen Teilen oder Teilen mit Stimme
Möglicherweise möchten Sie ein (kostenloses, plattformübergreifendes) Programm wie Audacity verwenden, um die Wellenform der MP3-Datei anzuzeigen. Mit der Wellenform können Sie sehen, wo "der größte Teil" der Aktion ist.
Zum Beispiel sind die von mir markierten bräunlichen Bereiche diejenigen, die eine bestimmte Schwelle überschreiten. Es sind höchstwahrscheinlich diejenigen mit den Sprachdaten, die Sie suchen.
Die anderen (blauen) Teile enthalten möglicherweise keine relevanten Informationen oder Sprache, da sie nicht so laut sind wie die anderen.
Sehen Sie sich auch die Lücken dazwischen an - diese helfen Ihnen, Teile zu identifizieren, in denen wirklich nichts los ist. Sie könnten die Datei dort schneiden und teilen, um verschiedene "Interviews" (oder was auch immer Sie aufzeichnen) zu erhalten.
Rauschunterdrückung
Um Rauschen zu vermeiden, können Sie versuchen, den Equalizer-Effekt zu verwenden und bestimmte Frequenzen herauszufiltern. Sie müssen damit experimentieren, da nicht jedes Aufnahmegerät gleich ist und sich die Geräuschbedingungen ändern.
Allerdings können Sie versuchen, Frequenzen zwischen 500 Hz und 1 kHz (oder sogar bis zu 4 kHz) zu verstärken und Frequenzen unter 500 Hz und über 8 kHz zu senken.
Audacity verfügt auch über bestimmte Rauschunterdrückungsfilter, um statische Aufladungen, Rauschen, Brummen oder andere konstante Hintergrundgeräusche zu entfernen. Experimentiere mit denen.
quelle