Polyphone Musiktranskription scheint derzeit kein gelöstes Problem zu sein.
Wie wäre es mit der Umkehrung eines kleinen Teils des Problems. Gibt es irgendwelche spektralen Eigenschaften (von einer STFT), die verwendet werden können, um einige musikalische Akkorde aus dem Wahrscheinlichkeitsraum zu entfernen? (z. B. enthält dieser Tonausschnitt höchstwahrscheinlich keinen C # -Akkord oder eine Art verminderten Moll-Akkord, oder dies ist eine einzelne Note, kein Akkord usw.)
Angenommen, das Audio-Snippet ist mehr oder weniger stationär (vorübergehender Angriff entfernt usw.), und es ist sehr wahrscheinlich, dass für die meisten oder alle einzelnen Noten Obertöne vorhanden sind. (Und bei dieser Frage geht es nicht um invertierte Akkorde.)
music
frequency-spectrum
hotpaw2
quelle
quelle
Antworten:
Das Problem der polyphonen Musiktranskription hat in den letzten Jahren in der Forschungsgemeinschaft große Beachtung gefunden, und ich würde sagen, dass die Ergebnisse für Polyphonien mit einem Instrument (Klavier, Gitarre usw.) sehr gut sind. Hier sind einige Artikel / Autoren, die sich intensiv mit diesem Problem befasst haben. Derry Fitzgerald hat viel in der Gegend getan, viele seiner NMF-Arbeiten zur Quellentrennung produzieren genaue Transkriptionen. Anssi Klapuri hat das Problem der Akkorderkennung in Polyphonien mit mehreren Instrumenten noch genauer untersucht. Und schließlich hat Mikel Gainza , obwohl nicht veröffentlicht, sehr genaue Akkordtranskriptionsalgorithmen für kommerzielle Musik entwickelt, die bald in einem gitarrenbasierten Softwareprodukt Riffstation veröffentlicht werden. Die Veröffentlichungen in den Links hier sollen Ihnen eine gute Vorstellung davon geben, wie die polyphone Musik-Transkriptionslandschaft derzeit aussieht.
quelle
Nun, dafür enthält die STFT nur eine Grundfrequenzkomponente und andere Frequenzen, die in der Nähe ihrer Harmonischen liegen (jedoch wegen der Inharmonizität nicht exakt ). Finden Sie die Peaks im Spektrum und prüfen Sie, ob die höheren Frequenzen nahe an ganzzahligen Vielfachen der niedrigsten vorhandenen Frequenz liegen. Wenn nicht harmonische Frequenzen vorhanden sind, ist dies kein einzelner Ton.
(Aber was ist mit Instrumenten, bei denen ein Grundton fehlt oder die grundsätzlich unharmonisch sind, wie Glocken? Was ist mit zwei perfekt aufeinander abgestimmten Instrumenten, die eine Oktave voneinander entfernt spielen, sodass ihre Partials meistens in einer Linie zueinander liegen? zwei Notizen?)
quelle