Signalverarbeitung

16
Finden Sie ähnliche Musik mit FFT-Spektren

Ich habe einige Wochen lang experimentiert, um einen Weg zu finden, ähnliche Songs in einer Bibliothek mit verschiedenen Musikrichtungen zu finden. Mein erster Versuch war, Features wie Tempo oder wie viel Bass in Songs vorhanden sind, um Gruppen zu bilden, aber ich bin mit diesem Ansatz (Volume...

15
Niedrigere Frequenzen stärker in der FFT?

Ich berechne die FFT aus dem Mikrofoneingang. Ich bemerke, dass niedrigere Frequenzen immer mehr Leistung (höhere dB) als höhere Frequenzen zu haben scheinen. Ich schneide die Daten in Frames von 24576 Bytes (4096 * 6). Hamming-Fenster anwenden: input[i] *= (0.54d - 0.46d*(double)...

15
Mittlere Normalisierung des Cepstrums

Kann mir jemand bitte erklären, wie sich die Äquivalenz der Faltung auf die Cepstral Mean Normalization auswirkt? Muss CMN für die MFCC-basierte Sprechererkennung verwendet werden? Warum ist das Eigentum der Faltung das Grundbedürfnis des MFCC? Ich bin sehr neu in dieser Signalverarbeitung. Bitte...

15
Was ist ein Frequenzbereich?

Ich recherchiere über die FFT-Methode und ein Begriff, der immer wieder auftaucht, ist "Frequency Bin". Soweit ich weiß, hat dies etwas mit der Band zu tun, die um die Frequenz einer bestimmten Sinuskurve erzeugt wurde, aber ich kann nicht wirklich herausfinden, wie. Ich habe auch herausgefunden,...

15
Lesen des Wavelet-Transformationsplots

Ich habe Probleme zu verstehen, wie die von einer Wavelet-Transformation geplottete Handlung zu lesen ist. Hier ist mein einfacher Matlab-Code. load noissin; % c is a 48-by-1000 matrix, each row % of which corresponds to a single scale. c = cwt(noissin,1:48,'db4','plot'); Der hellste Teil...