Vor ein paar Tagen war ich in meinem Studium in einer Klasse über Elektronik. Die erste Lektion war eine Einführung in das Hauptfach, Bits, analoge Signale, Konvertierung usw. Ein Beispiel wurde vom Lehrer gefragt: In welcher maximal möglichen Anzahl von Bits können Audioinformationen gespeichert werden?
Einige der Antworten, die durch die Klasse geworfen wurden, waren "64 Bit, 32 Bit, 16 Bit, 8 Bit (ja, ich weiß ...) ...".
dann sagte der Lehrer, dass es ungefähr 18,19 Bit sind, dann erreichen Sie die Obergrenze, weil Verzerrungen, Rauschen usw. eine große Rolle für Audioaufnahmen spielen.
Ich weiß, dass die typische DVD / Studio-Qualität 24-Bit-Audio ist.
Dies brachte mich jedoch zum Nachdenken: Was ist die maximale physische / reale / elektronische Bitgröße, in der ein Stück Audio gespeichert werden kann? Wäre 32-Bit-Audio übertrieben / würde es zu viel Rauschen enthalten?
Irgendwelche Erklärungen / Quellen dazu?
quelle
Antworten:
Wie Dzarda kommentiert, ist dies keine vernünftige Frage, und es ist nicht klar, was Sie unter "Stück" verstehen. Wenn Sie Probe meinen, können Sie es in so vielen Bits speichern, wie Sie speichern können. Typische HDs enthalten 1 TB und mehr, sodass 8 Tera Bits in Reichweite sind.
Es ist übertrieben, genauso wie es keinen Sinn macht, Ihr Fahrrad mit einer sehr schweren Kette zu schützen, die mit einem weichen Plastikvorhängeschloss verschlossen ist. Du solltest besser weniger Geld für die Kette ausgeben und damit ein besseres Vorhängeschloss kaufen.
Nehmen wir als Argument an, dass das Signal / Rausch-Verhältnis der analogen Teile Ihres Audiosystems 16 Bit entspricht. Wenn Sie als 18-Bit gespeicherten digitalen Sound wiedergeben, der 25% des Rauschpegels hinzufügt, wird das Rauschen um 25% erhöht. (von 100 bis 125 in willkürlichen Einheiten). 20 Bit erhöhen es um 6,25%. 32 Bit um 0,0015%. Das heißt: vorausgesetzt, Sie haben eine perfekte Übersetzung von digital nach analog.
Die Speicherkosten steigen linear mit der Bitgröße, die Kosten eines vollbereichsgenauen D / A-Wandlers steigen fast exponentiell an, wenn Sie sich einer bestimmten Anzahl von Bits nähern (~ 22?). Die Verwendung von mehr Bits als der entsprechenden Qualität in den analogen Teilen kostet also mehr, aber der Qualitätsgewinn nimmt ab. Es ist also einfach nicht wirtschaftlich, mehr Bits zu verwenden: Wenn Sie mehr Geld ausgeben möchten, um eine bessere Qualität zu erzielen, sollten Sie es für die analogen Teile ausgeben. (Ich bin kein Audiophiler, aber AFAIK, der Sprecher, ist oft das schwächste Glied.)
Dies ist ein allgemeines Thema in der Technik: Es geht nicht darum, einzelne Teile so gut wie möglich zu machen, sondern um ein ausgewogenes Design.
quelle
Die Technologie könnte es Ihnen ermöglichen, (fast) unendlich große (Samples / Sek.) Und unendlich tiefe (Bits) Daten zu speichern, und tatsächlich speichern viele Dinge solche Dinge: Es gibt viele Kameras, die schneller und detaillierter als Menschen aufnehmen können Augen können zum Beispiel 500 Bilder pro Sekunde sehen. Ebenso gibt es wissenschaftliche Instrumente wie Seismometer, die (vereinfacht) Mikrofonen sehr ähnlich sind, aber weitaus empfindlicher als das menschliche Ohr, und die aufgezeichneten Daten werden wahrscheinlich detaillierter gespeichert, als ein Mensch direkt interpretieren könnte, wenn sie in der realen Welt wiedergegeben würden Ebenen. Diese verschiedenen Geräte werden jedoch fast immer zum Erfassen von Dingen verwendet, damit wir sie auf andere Weise analysieren können: eine Welle in einem Diagramm, ein Zeitlupenvideo usw.
Zurück zur Audioaufnahme und -wiedergabe: Es gibt wieder wissenschaftliche Instrumente und Testinstrumente, mit denen Signale von weitaus besserer Qualität (wie Auflösung / Tiefe / Genauigkeit) abgetastet, aufgezeichnet, reproduziert und erzeugt werden können, als Menschen verarbeiten können, aber es macht nicht viel Sinn, sie zu haben in einem Aufnahmestudio.
In einem wirklich guten mehrspurigen Studio möchten Sie vielleicht eine bessere Qualität, als Menschen erkennen können, wenn Sie viele Dinge zusammenfügen. Je weniger Fehler Sie einführen, desto besser wird der endgültige Mix. Wieder vereinfacht; Wenn Sie alle harten Summen mit 4 Dezimalstellen ausführen, muss Ihre endgültige Antwort möglicherweise nur auf 1 Dezimalstelle lauten, kommt aber möglicherweise immer noch besser heraus, da Sie nicht so viel an Rundungsfehlern verloren haben.
Im letzten Fall (menschlicher Verzehr) gibt es nur so viel, was Menschen erkennen können, so dass die Ausrüstung im Allgemeinen gut genug dafür ist, denn warum sollten Sie mehr Arbeit ohne Gewinn tun?
Als Beispiel: Die digitale Bildgebung hat 8 Bit pro Farbe erreicht, da das Auge nicht mehr als 256 Graustufen / die Gesamtkombination von 16,8 Millionen Farben und Schattierungen unterscheiden kann. Wir haben heutzutage 64-Bit-PCs und viel bessere Digitalkameras. Wir könnten 16 Bit pro Farbe speichern, aber die Leute können 281.474.976.710.656 verschiedene Farben nicht sehen und wir würden viel Mühe damit verschwenden, diese Daten zu erfassen und zu speichern.
Ebenso wird niemand für ein Aufnahmestudio mit Geräten bezahlen, die eine Fliege im hinteren Teil des Raums über jemanden hören, aufnehmen, aufnehmen und reproduzieren können, der ein Drumkit schlägt, wie es niemand jemals hören wird, selbst wenn es es ist Dort.
quelle
Spaß .. mit einigen Zahlen zu spielen. Nehmen wir 1 kOhm Quellenimpedanz an. (Sie müssen etwas annehmen.) Das hat also ~ 4nV / rtHz Johnson-Rauschen. Bei einer Bandbreite von 10 kHz sind das ~ 400 nV Rauschen. OK und nehmen an, es hat bis zu 5 Volt gewonnen und gespeichert. Das sind ungefähr 10 ^ 7 im Dynamikbereich ... 23 Bit. (Im wirklichen Leben wird es mehr Lärm geben ...)
quelle
Bei Audio, das per Telefon übertragen wird, werden die Quantisierungspegel für den A / D durch das Rauschpegelmodellierungssystem bestimmt. Das heißt, wir sollten die Quantisierungspegel nicht erhöhen, da Rauschen in den konvertierten Werten enthalten ist. Darüber hinaus reagiert das Ohr nicht linear, so dass zur Optimierung der Bandbreite des vom Telefon übertragenen Signals eine nichtlineare Konvertierung verwendet wird, die es ermöglicht, das Audio in 8-Bit zu codieren und ein verständliches Signal wiederherzustellen.
Offensichtlich ist die Qualität der Audioübertragung für ein Telefon nicht für ein System mit High-Fidelity-Audio vorgesehen.
Kurz gesagt, die Theorie besagt, dass es keine Obergrenze für die Anzahl der Quantisierungspegel eines Audiosignals gibt, aber in der Praxis kann das im System vorhandene Rauschen eine Obergrenze setzen. Weitere Informationen finden Sie unter diesem Link .
quelle
32-Bit-Audio, das im Gleitkommaformat bei gespeichert ist, ist in der professionellen Industrie üblich. Dies bedeutet jedoch, Rundungsfehler während der digitalen Verarbeitung zu reduzieren, wo sie durch alle Arten von digitalen Filtern und Transformationen stark verarbeitet werden. Ich glaube nicht, dass irgendjemand bei der Aufnahme oder Wiedergabe von Dingen zwischen 24 Bit bei 192 kHz und tieferem, schnellerem Sampling unterscheiden kann. Wahrscheinlich nicht einmal Fledermäuse.
quelle
Es scheint, dass Sie einige grundlegende Begriffe verstehen müssen. Es gibt AD <-> DA-Wandler mit unterschiedlichen "Bit" -Größen und unterschiedlichen Betriebsfrequenzen. Die Bitgröße beeinflusst die Genauigkeit der "Abtastung", während die Frequenz die Abtastrate beeinflusst. Normalerweise haben Sie ein Audiosignal, das Sie digitalisieren möchten. Die erste Frage, die Sie beantworten müssen, lautet: Wie genau muss die Stichprobe sein? Je höher die Anzahl der verwendeten Bits ist, desto höher ist die Qualität des wiedergegebenen Audios und desto höher sind die Kosten des Konverters. Je höher die Abtastrate, desto höher die Qualität des wiedergegebenen Audios und desto höher die Kosten des Konverters. Die erste praktische Grenze ergibt sich also aus den Kosten des Konverters. Es gibt eine weitere praktische Grenze, die durch die "menschliche Sensibilität" auferlegt wird. Wenn unsere Ohren keinen Unterschied zwischen dem Original und dem wiedergegebenen Audio feststellen können, sind die Anzahl der Bits und die dazu verwendete Abtastrate "gut genug". Aufgrund dieser Informationen glaube ich, dass Ihre Frage lauten sollte:
Was sollte die maximale, praktische Anzahl von Bits (eines AD <-> DA-Wandlers) sein, um eine akzeptable Kopie eines Audiosignals reproduzieren zu können ?
Ich glaube, dass geeignete Berechnungen ungefähr 18 Bit mit einer Abtastrate von 150 kHz ergeben würden.
quelle