Danke für den Hinweis! Sie haben vergessen, Ihre Arbeit an der Schlagzeugverbesserung zu erwähnen , was auch für die Anwendung von Summer_More_More_Tea von Interesse sein kann. Nun, das hängt wirklich davon ab, was Sie damit machen wollen. Haben Sie eine bestimmte "Endanwendung" im Sinn?
Ich stimme den obigen Aussagen von pichenettes vollkommen zu. Abschließend möchte ich jedoch sagen, dass die von Ihnen erwähnte Stimmverbesserung auch in einigen Werken von Matti Ryynänen zur Karaoke-Track-Generation verwendet wurde, um die Ergebnisse zu verbessern.
Um Ihre Fragen zu beantworten:
Welche ist angesichts der Wirksamkeit die bevorzugte (oder eine andere) Lösung?
Wie Pichenetten sagten, scheint beides nicht Ihren Bedürfnissen zu entsprechen: Tiefpass- / Hochpassfilterung scheitern mit Sicherheit an der harmonischen Struktur der menschlichen Stimme (und generell an "interessanten" Geräuschen - also alles, was über die Sinuskurven hinausgeht ... ).
Wenn der 2. Kanal zwei Kanäle A und B hat, wird (BA) oder (AB) für die Berechnung des Hintergrunds verwendet? Bedeutet die Arithmetik wie beim Zusammenführen von zwei Kanälen genau genug?
Auch die zweite Methode, die Sie erwähnen, funktioniert nicht, da Sie nur das Signal entfernen können, das sich in der Mitte befindet, und nicht abrufen können. Mit anderen Worten, auch wenn der Gesang im "Zentrum" liegt, gibt es keine einfache Mathematik, um nur ein Signal für den Gesang zu erhalten.
Oder kann ich jeden Kanal um den Faktor zwei heruntersampeln und die heruntergesampelten Signale als Mono-Ergebnis verschachteln?
er ... Die Mittelung der Kanäle, um ein Monokanalsignal zu erhalten, wie oben vorgeschlagen, ist sinnvoll und beeinträchtigt die spektralen Eigenschaften Ihres Signals nicht (vorausgesetzt, das Stereosignal ist nicht entartet). Sie erhalten also ein Monosignal, in dem Sie im Grunde den gleichen musikalischen Inhalt wie zuvor haben.
Ein korrektes Downsampling für jeden Kanal bedeutet, dass Sie zuerst einen Tiefpassfilter (in Ihrem Fall mit der Grenzfrequenz von sample_rate / 4) anwenden und dann alle 2 Samples sicher abtasten können. Über die Verschachtelung der so heruntergetasteten Kanäle gibt es jedoch nicht viel zu sagen: In den meisten Fällen führt dies zu einer Störung der spektralen Eigenschaften Ihres Signals. Das wollen Sie wahrscheinlich nicht.
In der Tat führt die Operation der Tiefpassfilterung, gefolgt von dem Setzen auf 0 alle 2 Abtastwerte und dem Halten dieser Nullen im Fourier-Bereich zum "Spiegeln" der Niederfrequenzkomponenten, die auf den Hochfrequenzkomponenten gehalten wurden. Denken Sie daran, dass Sie Lektionen zur Signalverarbeitung in der Abtasttheorie lernen: Multiplizieren mit einer Folge von Impulsen (oder Diracs) führt zu einer Faltung mit einer anderen Folge von Diracs im Fourier-Bereich, dh in diesem Fall wird das Frequenzspektrum des Signals wiederholt (periodisiert). entlang der Frequenzachse mit einer Periode gleich der Abtastrate.
Normalerweise entfernen Sie beim Downsampling die Nullen (da Sie eine neue Abtastrate annehmen). Hier führt die Beibehaltung jedoch zu sehr störenden zusätzlichen Hochfrequenzkomponenten. Das Verschachteln dieser Signale wird dies nicht korrigieren.
Alles in allem die kurze Antwort: Tu das nicht . :-)
Zum Schluss kann ich Ihnen auch vorschlagen, die GUI zu verwenden, die ich für die LVAICA 2012-Konferenz entwickelt habe: Es gibt ein Git-Repo dafür. Ich bin immer noch am Debuggen und Verbessern, daher sind Kommentare willkommen: D
Ich hoffe, das hilft!