Rekonstruktionsfilter - Wie funktioniert das eigentlich?

8

Ich versuche, mein eigenes Verständnis für den Religionskrieg um 192kHz als Abtastrate für die Wiedergabe zu entwickeln (das Internet scheint auf beiden Seiten eine Fülle von Material zu haben). Ich habe Probleme zu verstehen, wie Rekonstruktionsfilter funktionieren.

Das Nyquist-Shannon-Abtasttheorem , das oft vom Anti-192-Lager zitiert wird, besagt grundsätzlich, dass eine Abtastrate von 44,1 kHz ausreicht, um ein bandbegrenztes Signal von 20 kHz verlustfrei zu rekonstruieren. Wenn ich mir jedoch die Whittaker-Shannon-Interpolationsformel anschaue , scheint es mir, dass ein idealer Rekonstruktionsfilter Zugriff auf alle Proben haben muss , dh auf alle vergangenen und alle zukünftigen Proben.

Ich bin kein Experte für analoges Audio, aber ich bezweifle, dass ein solches Gerät gebaut werden kann. Ich würde annehmen, dass bestenfalls eine Verzögerung eingeführt werden kann, um auf das Eintreffen genügend zukünftiger Abtastwerte zu "warten", so dass der Beitrag nicht verfügbarer zukünftiger Abtastwerte zum aktuellen Ausgangszeitpunkt vernachlässigbar wird.

Kann jemand erklären, wie praktische Rekonstruktionsfilter funktionieren und welche Nachteile sie haben? Gibt es eine theoretisch strengere Grenze für das Nyquist-Shannon-Theorem, wenn nur ein Fenster mit Stichproben verfügbar ist oder wenn die Latenz der Rekonstruktion nicht akzeptabel ist?

user1202136
quelle

Antworten:

1

Durch Ermöglichen einer Erhöhung der Verzögerung, die durch ein digitales Überabtastungsfilter eingeführt wird, können die anderen Eigenschaften des Filters, der Durchlassband- und Stoppbandwelligkeit und der Übergangsbandbreite so verbessert werden, dass sie beliebig nahe bei Null liegen. Der Überabtastungsfaktor kann erhöht werden, um das Stoppband zu erweitern und die Anforderungen an die analoge Filterung zu lockern, was zu einer erhöhten Rechenkomplexität führt, jedoch zu keiner signifikanten Erhöhung der durch das Filter eingeführten Verzögerungszeit.

Audio-DACs verfügen normalerweise über ein digitales Oversampling-Filter, das zwischen einem Filter mit geringer Zeitverzögerung (Latenz) und einem Roll-Off-Filter mit scharfem Frequenzgang ausgewählt werden kann. Das Filter mit niedriger Verzögerung kann ein Minimalphasenfilter oder ein psychoakustisch abgestimmter Kompromiss zwischen geringer Dispersion (einige Frequenzen sind stärker verzögert als andere) und geringer effektiver Verzögerung sein. Das scharfe Abrollfilter ist typischerweise ein lineares Phasenfilter mit einer symmetrischen Impulsantwort und einer spezifizierten maximalen Welligkeit im Durchlassband und im Stoppband. Diese Art von Spezifikation lässt sich leicht in einem Datenblatt ausdrücken und in ein Systemdesign integrieren. Vergleichbare Equiripple-Linearphasenfilter können in Oktave unter Verwendung des remezgleichen Gewichts von Durchlassband und Stoppbandwelligkeit entworfen werden :

pkg load signal
x2x = []; x4x = [];
for n = [16:86]
  b2x = remez(2*n, [0, 20/44.1, (44.1-20)/44.1, 1], [1, 1, 0, 0], [1, 1], "bandpass", 128);
  b4x = remez(2*n, [0, 20/(44.1*2), (44.1-20)/(44.1*2), 1], [1, 1, 0, 0], [1, 1], "bandpass", 128);
  [h2x, w2x] = freqz(b2x); [h4x, w4x] = freqz(b4x);
  x2x = [x2x; (length(b2x)-1)/2/2, 20*log10(abs(h2x(end)))];
  x4x = [x4x; (length(b4x)-1)/2/4, 20*log10(abs(h4x(end)))];
endfor
plot(x2x(:,1), x2x(:,2), "x", x4x(:,1), x4x(:,2), "x", 29.2, -100, "x", 39.5, -110, "x", 43.3828125, -110, "x")
xlabel("group delay / f_s");
ylabel("stop band ripple (dB)");
text(29.2-2, -100-4, "AK4499");
text(39.5-2, -110+4, "CS43198");
text(43.3828125-2, -110-4, "AD1955");
grid on

Das Skript entwirft verschiedene Ordnungsfilter (begrenzt durch das, was remezohne numerische Probleme gehandhabt werden kann) für ein Durchlassband von 0 bis 20 kHz und ein Stoppband ab 24,1 kHz, die bei einer kleinen Auswahl von Überabtastabtastfrequenzen von 2 und 4 Mal betrieben werden Die Abtastfrequenz von 44,1 kHz und die Diagramme der Stop-Band-Welligkeit (Abb. 1) zusammen mit denen der äquivalenten digitalen Oversampling-Filter von Flaggschiff-Audio- DACs von Asahi Kasei ( AK4499 ), Analog Devices ( AD1955 ) und Cirrus Logic ( CS43198 ).

Geben Sie hier die Bildbeschreibung ein
Abbildung 1. Welligkeit des remezStoppbandes und des Durchlassbandes für 2x (blau) und 4x (orange) Oversampling-entworfene Linearphasen-Tiefpass-Digitalfilter mit gleichem Durchlass- und Stoppbandgewicht als Funktion der Impulsantwort halber Länge in Einheiten von Abtastperiode bei der 1x Abtastfrequenz von 44,1 kHz. Es sind auch Leistungswerte für die Stop-Band-Welligkeit für eine Auswahl von DAC-Oversampling-Filtern aufgetragen, wobei die entsprechende Durchlassband-Welligkeit als 5 × 10 ^ -3 dB für das 8x-Oversampling-Digitalfilter von AK4499, 10 ^ -2 dB für das kombinierte Digital- und Analogfilter von CS43198 und 2 × 10 ^ -4 dB für das digitale 8x-Oversampling-Filter von AD1955. Alle hier verglichenen Filter haben identische Übergangsbandgrenzen: 20 kHz bis 24,1 kHz.

Für eine Abtastfrequenz von 44,1 kHz gibt Fig. 1 eine Untergrenze für die Leistung des digitalen Filters mit linearer Phasenüberabtastung als Funktion der vom Filter eingeführten Verzögerung an, wenn Durchlassband und Stoppbandwelligkeit gleich gewichtet sind. Diese Grenze hängt nicht wesentlich vom Überabtastungsverhältnis ab. DAC-Hersteller können eine andere Gewichtung wählen, um beispielsweise durch Erhöhen der Durchlassbandwelligkeit eine geringere Welligkeit des Stoppbands zu erzielen, wie im Fall von AK4499. Sie können die Filter auch nach anderen Kriterien als dem strengen Equiripple optimieren. Beispielsweise kann das Filter eine Kompensation für die Dämpfung hoher Frequenzen durch die analoge Schaltung (Halten nullter Ordnung, RC-Filter usw.) enthalten, und die Filterverzögerungseigenschaften können unter der Verwendung einer rechnerisch effizienten Mehrratenimplementierung leiden.

Wir können uns das Filter mit der höchsten Leistung in Abb. 1 genauer ansehen remez(2*86, [0, 20/44.1, (44.1-20)/44.1, 1], [1, 1, 0, 0], [1, 1], "bandpass", 128), indem wir seine Impulsantwort (Abb. 2) und Frequenzantwort mit freqz(Abb. 3) auftragen:

Geben Sie hier die Bildbeschreibung ein
Abbildung 2. Impulsantwort des leistungsstärksten linearen 2x-Oversampling-Filters aus remez.

Geben Sie hier die Bildbeschreibung ein
Abbildung 3. Frequenzgang des leistungsstärksten linearen 2x-Oversampling-Filters aus remez.

Es wäre interessanter, sich 8x Oversampling-Filter anzusehen, remezschlägt aber mit fehl error: remez: insufficient extremals--cannot continue.

Olli Niemitalo
quelle
Wissen Sie; Wenn etwas (Audiosystem) wirklich gut klingt, dann muss seine Erklärung (Datenblatt) noch besser sein! .. :-) So machen sie es in der kommerziellen
Audioindustrie
Beeindruckend! Ich muss Ihre Antwort noch einige Male erneut lesen, um sie vollständig zu verarbeiten. Gut gemacht! Um zu bestätigen, dass ich das Wesentliche verstanden habe, führt ein hochwertiger DAC mit digitalem Oversampling eine Verzögerung von 0,6-1 ms bei einer Abtastfrequenz von 44,1 kHz ein.
user1202136
@ user1202136 ja das ist richtig, wenn der scharfe Abrollfilter ausgewählt ist.
Olli Niemitalo
4

Das Abtasttheorem erfordert ein perfekt bandbegrenztes Signal, das auf das Doppelte der Abtastfrequenz begrenzt ist. Das Problem dabei ist, dass nur ein Signal mit unendlicher Länge (z. B. vor dem Urknall vorhanden) perfekt bandbegrenzt werden kann. Dies ergibt sich aus dem Fourier-Theorem für jede Domäne mit endlicher Unterstützung.

Somit sind alle realen Signale unvollständig bandbegrenzt, begrenzt durch die Länge der Aufzeichnungssitzung und die Dauer der Impulsantwort der vor dem Abtasten verwendeten Tiefpassfilterung (z. B. unvollständige Bandbegrenzung). Sie müssen also aufgrund des Sample-Aliasing ein endliches Grundrauschen annehmen. Daher muss Ihre Rekonstruktion auch nicht besser sein als dieses Grundrauschen. Daher können Sie die perfekte Rekonstruktionsformel auf eine angemessene endliche Dauer einstellen. Für Audio kann diese Fensterbreite auf ein kleines Vielfaches der Periode der niedrigsten hörbaren Frequenz begrenzt werden, da Dinge davor und danach die Wahrnehmung der hörbaren Tonhöhe nicht wesentlich beeinflussen können (andere Dinge wie Maskierung und adaptive Schwellenwertbildung) usw. wahrscheinlich dominieren).

Der Vorteil sehr hoher Abtastraten besteht darin, dass die Alias-Frequenzen (aufgrund der unvollständigen Filterung vor der Abtastung und der Rekonstruktion nach der Abtastung) noch höher sind und weitaus weniger wahrscheinlich von einem physikalischen Mikrofon aufgenommen werden oder mit einer signifikanten Größe (oben) passieren das thermische Grundrauschen usw.) durch die Anti-Aliasing-Filter. Wie andere Antworten hier ausführlich beschreiben, ermöglicht dies auch, dass physikalisch realisierbare Filter flacher sind und eine linearere Phasenantwort im generischen 20-20k-Durchlassband aufweisen und sich der Hälfte der Abtastrate annähern.

hotpaw2
quelle
Die vorgeschlagene Beziehung zwischen der Fensterbreite und der niedrigsten hörbaren Frequenz ist rein zufällig, oder?
Olli Niemitalo
2

Eine schnelle Antwort, aber da das menschliche Gehör die Bandbreite von 20 kHz nicht überschreitet, reichen 44,1 kHz zum Speichern und Übertragen von Audio aus. Das Problem ist, dass der analoge Antialiasing-Filter vor dem ADC extrem scharf sein muss, um 20 kHz genug zu passieren und 22,05 kHz genug zu blockieren, und dies erfordert nur viele Komponenten mit guter Leistung und Toleranz. Wenn mit einer höheren Rate wie 192 kHz abgetastet wird, kann das analoge Filter einfacher und billiger sein, da es ein viel breiteres Übergangsband hat. Es muss 20 kHz passieren und bei 96 kHz blockieren. Die Ratenumwandlung und Tiefpassfilterung kann digital erfolgen, um einen scharfen Cutoff ohne Aliasing zu erzielen. Das Gleiche gilt für die Audiowiedergabe. Wenn Sie das Signal für die Wiedergabe auf 192 kHz hochabtasten und digital rekonstruieren, kann der analoge DAC-Ausgangsfilter billig und einfach sein. Das Rekonstruktionsfilter muss nur so gut sein, dass nach der 20-kHz-Audiobandbreite nicht viel Alias-Spektralbild vorhanden ist, und das Analogfilter entfernt die tatsächlichen Spektralbilder der DAC-Rate. Daher ist es sinnvoll, bei ADC und DAC höhere Raten zu verwenden und möglicherweise Audio zu beherrschen, aber das Senden und Speichern von Frequenzen, die nur Hunde und Fledermäuse hören können, kostet nur mehr, ganz zu schweigen von Geräten (Verstärker, Lautsprecher), die diese erzeugen können ohne Probleme. Grundsätzlich ist jede digitale Probe nur ein unendlich enger Impuls, und Impulse, die mit Abtastrate wiederholt werden, erzeugen die Spektralbilder, die durch ein Rekonstruktionsfilter herausgefiltert werden müssen, das einfach das beabsichtigte Basisbandsignal intakt lässt. Daher ist es sinnvoll, bei ADC und DAC höhere Raten zu verwenden und möglicherweise Audio zu beherrschen, aber das Senden und Speichern von Frequenzen, die nur Hunde und Fledermäuse hören können, kostet nur mehr, ganz zu schweigen von Geräten (Verstärker, Lautsprecher), die diese erzeugen können ohne Probleme. Grundsätzlich ist jede digitale Probe nur ein unendlich enger Impuls, und Impulse, die mit Abtastrate wiederholt werden, erzeugen die Spektralbilder, die durch ein Rekonstruktionsfilter herausgefiltert werden müssen, das einfach das beabsichtigte Basisbandsignal intakt lässt. Daher ist es sinnvoll, bei ADC und DAC höhere Raten zu verwenden und möglicherweise Audio zu beherrschen, aber das Senden und Speichern von Frequenzen, die nur Hunde und Fledermäuse hören können, kostet nur mehr, ganz zu schweigen von Geräten (Verstärker, Lautsprecher), die diese erzeugen können ohne Probleme. Grundsätzlich ist jede digitale Probe nur ein unendlich enger Impuls, und Impulse, die mit Abtastrate wiederholt werden, erzeugen die Spektralbilder, die durch ein Rekonstruktionsfilter herausgefiltert werden müssen, das einfach das beabsichtigte Basisbandsignal intakt lässt.

Nur ich
quelle
"Dasselbe gilt für die Audiowiedergabe, das Upsampling und die digitale Rekonstruktion des Signals auf 192 kHz für die Wiedergabe": Hier habe ich Schwierigkeiten zu verstehen. Sagen ist der Ausgang Upsampling bei 192kHz und ist der Eingang 48 kHz. Müssen Sie nicht alle kennen, um genau zu berechnen ? Wenn ja, wie können Sie in Echtzeit ein Upsampling durchführen, wenn Sie keine Eingabe-Samples nach ? y[4n]x[n]y[j]x[i],i=0,nj/4
user1202136
1
Gut realisierbare digitale Filter können nicht in die Zukunft sehen, daher sind sie kausal und funktionieren nur mit gegenwärtigen und vergangenen Beispielen. Daher hat ein symmetrisches FIR-Filter mit N Abgriffen eine Verzögerung von N / 2 Abgriffen. Und der Filter hat eine vernünftige Anzahl von Abgriffen, nur genug, um innerhalb der angegebenen Toleranz genügend Filter zu haben. Oder es könnte ein IIR-Filter sein. Oder Biquad. Oder mehrere kaskadierte Filter. Oder gar kein Filter, fügen Sie einfach Nullen zwischen den tatsächlichen Samples hinzu und lassen Sie den analogen Filter die Arbeit erledigen.
Justme
2

Grund - Audioanwendungen unter Berücksichtigung der Digital - Analog - Umwandlungsrekonstruktionsfilter (auch bekannt als Interpolationsfilter) ist ein Tiefpass - Analogfilter , das all Bildspektrum am Ausgang entfernt , bevor es zu Lautsprechern geht und behält nur das Basisbandspektrum , das besteht in dem Filter des Durchlassband : innerhalb seiner Grenzfrequenz des Tiefpassfilters. Beachten Sie, dass der Lautsprecher selbst auch ein wichtiger Bestandteil der Eigenschaften des Rekonstruktions-Tiefpassfilters ist und ideale Filter unter geeigneten Bedingungen ausreichend entspannt werden können.

Dieses Durchlassband (oder die Grenzfrequenz) des Interpolationsfilters sollte idealerweise gemäß der Eingangsabtastrate des digitalen Signals ausgewählt werden. Wenn das ursprüngliche Signal ohne Aliasing bei 44,1 kHz angemessen abgetastet wurde, sollten unter normalen Bedingungen (unter der Annahme, dass keine Abtastratenumwandlung innerhalb des Systems erfolgt) die Ausgangs- DAC-Abtastfrequenz und die zugehörigen Interpolationsfilter-Cutofff-Frequenzen als 44,1 kHz und 22,05 kHz ausgewählt werden beziehungsweise.

Wenn der Eingang mit 96 kHz abgetastet wurde, sollte die DAC-Frequenz der Ausgangsrekonstruktion 96 kHz betragen und das Rekonstruktionsfilter sollte eine Grenzfrequenz von 48 kHz usw. haben. Beachten Sie, dass die Theorie ideale Impulse und ideale Filter verwendet, um Dinge zu beschreiben ( wie oben beschrieben), aber die praktische DAC-Schaltung verwendet das Halten nullter Ordnung am Ausgang und praktische Filter.

Beachten Sie, dass bei einer Nichtübereinstimmung zwischen den Eingangs- und Ausgangsabtastraten die Wiedergabegeschwindigkeit nicht mit der Aufnahmegeschwindigkeit übereinstimmt. Wenn Sie eine niedrigere Grenzfrequenz als das erforderliche Minimum wählen, das die Nyquist-Frequenz der Ausgangs-DAC-Abtastrate ist, wird das Signalspektrum verworfen. Wenn Sie eine Grenzfrequenz für das Interpolationsfilter wählen, die größer als die Nyquist-Frequenz ist, tritt am Audioausgang eine Bildverzerrung auf.

In einem der religiösen Kriege um digitales Audio geht es darum, ob eine Abtastrate von 96 kHz am Eingang wirklich notwendig ist oder nicht. Und der Konsens (?) Ist, dass es nicht notwendig ist, basierend auf empirischen Tests, die so oft durchgeführt wurden. Aber Auidophile können ihre freien Abtastraten trotzdem frei wählen.

Fat32
quelle
"Beachten Sie, dass die Theorie ideale Impulse und ideale Filter verwendet, um die Dinge zu beschreiben (wie ich es oben getan habe), aber die praktische DAC-Schaltung verwendet das Halten nullter Ordnung am Ausgang und praktische Filter." Wenn Sie diesen Satz vergrößern, bedeutet das nicht, dass die Verwendung nicht idealer Filter in der DAC-Phase zu einer unvollständigen Rekonstruktion des abgetasteten Analogeingangs führt? Erhöht die Verwendung eines nicht idealen Filters die Nyquist-Rate? (Ich kaufe die empirischen Argumente des Anti-192-Lagers total, aber ich habe das Gefühl, dass es eine Lücke in der theoretischen Argumentation um das Nyquist-Shannon-Theorem mit nicht idealem Fil gibt
user1202136
1
Die theoretische Antwort ist wie oben angegeben. Kommen wir zum praktischen Argument; Es ist wahr, dass zur Vereinfachung des Designs von (scharf abgeschnittenen) analogen Filtern eine Überabtastung des Eingangs (und des Ausgangs davon) verwendet werden kann. Und ja, von einem solchen System wird erwartet, dass es weniger verzerrtes Audio erzeugt. Aber hier gibt es nichts Psychoakustisches. Filtern Sie einfach das Design. Das Argument, ob der Inhalt über 20 kHz dem Audio einen Wert hinzufügt (hörbar oder relevant), ist meines Wissens nein . Sie würden also von der Einfachheit des Filterdesigns profitieren und möglicherweise eine etwas weniger verzerrte Ausgabe erhalten. Und das ist gut.
Fat32
2
Es mag überraschen, aber wenn der DAC einen Zero Order Hold hat, sind die Ausgangsspektren nicht flach, sondern bereits durch die Sinc-Hüllkurve verzerrt. Dies wird als Apertureffekt bezeichnet. Es dämpft hohe Frequenzen. Es kann bis zu einem gewissen Grad mit einem analogen Rekonstruktionsfilter kompensiert werden, der hohe Frequenzen verstärkt. Wieder ein weiterer Grund, 48 kHz auf 192 kHz am DAC hochzusampeln, damit die Audiobandbreite von 20 kHz weiter von der Abtastrate des DAC-Ausgangs entfernt ist. Jeder analoge oder digitale Filter muss nicht ideal und perfekt sein, sondern nur so gut, dass Sie keine Nicht-Idealiten hören (oder messen) können.
Justme
@Justme yes Die invertierte Sinc-Magnitude-Antwort wird vorgeschlagen, um die spektrale Verzerrung zu korrigieren ... Höhere Abtastraten würden die Realisierung erleichtern, und zwar auf Kosten von mehr Rechenleistung und Speicher (oder einer Auf- / Ab-Umwandlung, die selbst mehr Verzerrung erzeugen könnte als der nichtideale Rekonstruktionsfilter würde reichen! ;-))
Fat32