Der große Audio-Mythos: Warum brauchen Sie diesen 32-Bit-DAC nicht?

Autor: Randy Alexander
Erstelldatum: 1 April 2021
Aktualisierungsdatum: 1 Juli 2024
Anonim
Der große Audio-Mythos: Warum brauchen Sie diesen 32-Bit-DAC nicht? - Technologien
Der große Audio-Mythos: Warum brauchen Sie diesen 32-Bit-DAC nicht? - Technologien

Inhalt


Wie Sie wahrscheinlich bemerkt haben, gibt es in der Smartphone-Branche einen neuen Trend, Audio-Chips in Studioqualität in moderne Flaggschiff-Smartphones zu integrieren. Ein 32-Bit-DAC (Digital-Analog-Wandler) mit 192-kHz-Audiounterstützung sieht auf dem technischen Datenblatt zwar gut aus, es ist jedoch kein Vorteil, die Größe unserer Audiosammlungen zu erhöhen.

Ich bin hier, um zu erklären, warum dieses Rühmen von Bittiefe und Abtastrate nur ein weiteres Beispiel für die Audioindustrie ist, das den Mangel an Verbraucher- und sogar audiophilen Kenntnissen zu diesem Thema ausnutzt. Ziehen Sie Ihre Nerd-Caps an, wir gehen auf einige ernsthafte technische Punkte ein, um die Vor- und Nachteile von Pro-Audio zu erläutern. Hoffentlich beweise ich Ihnen auch, warum Sie den größten Teil des Marketing-Hype ignorieren sollten.

Hörst du das?

Bevor wir uns damit befassen, bietet dieses erste Segment einige Hintergrundinformationen zu den beiden Hauptkonzepten von digitalem Audio, Bittiefe und Abtastrate.


Die Abtastrate gibt an, wie oft Amplitudeninformationen zu einem Signal erfasst oder wiedergegeben werden. Im Wesentlichen zerlegen wir eine Wellenform in viele kleine Teile, um zu einem bestimmten Zeitpunkt mehr darüber zu erfahren. Das Nyquist-Theorem besagt, dass die höchstmögliche Frequenz, die erfasst oder reproduziert werden kann, genau die Hälfte der Abtastrate beträgt. Dies ist recht einfach vorstellbar, da wir die Amplituden für die Ober- und Unterseite der Wellenform benötigen (was zwei Abtastwerte erfordern würde), um ihre Frequenz genau zu kennen.

Das Erhöhen der Abtastrate (oben) führt zu zusätzlichen Abtastwerten pro Sekunde, während eine größere Bittiefe (unten) mehr mögliche Werte zum Aufzeichnen des Abtastwerts bietet.

Bei Audio geht es uns nur um das, was wir hören, und die überwiegende Mehrheit der Menschen hört kurz vor 20 kHz auf zu hören. Nachdem wir das Nyquist-Theorem kennen, können wir verstehen, warum 44,1 kHz und 48 kHz übliche Abtastfrequenzen sind, da sie etwas mehr als doppelt so hoch sind wie die maximale Frequenz, die wir hören können. Die Übernahme von 96-kHz- und 192-kHz-Standards in Studioqualität hat nichts mit der Erfassung von Daten mit höheren Frequenzen zu tun, was sinnlos wäre. Aber wir werden gleich darauf eingehen.


Bei der Betrachtung der Amplituden im Zeitverlauf bezieht sich die Bittiefe lediglich auf die Auflösung oder die Anzahl der verfügbaren Punkte, um diese Amplitudendaten zu speichern. Beispielsweise bietet 8-Bit 256 verschiedene Punkte zum Runden, 16-Bit-Ergebnisse ergeben 65.534 Punkte, und 32-Bit-Daten ergeben 4.294.967.294 Datenpunkte. Obwohl dies offensichtlich die Größe von Dateien stark erhöht.

Es mag leicht sein, sofort über die Bittiefe in Bezug auf die Amplitudengenauigkeit nachzudenken, aber die wichtigsten Konzepte, die hier zu verstehen sind, sind das Rauschen und die Verzerrung. Bei einer sehr niedrigen Auflösung werden wir wahrscheinlich Stücke mit Informationen mit geringerer Amplitude verpassen oder die Spitzen von Wellenformen abschneiden, was zu Ungenauigkeiten und Verzerrungen (Quantisierungsfehlern) führt. Interessanterweise klingt dies häufig nach Rauschen, wenn Sie eine Datei mit niedriger Auflösung wiedergeben, da wir das kleinstmögliche Signal, das erfasst und wiedergegeben werden kann, effektiv vergrößert haben. Dies entspricht genau dem Hinzufügen einer Rauschquelle zu unserer Wellenform. Mit anderen Worten, durch Verringern der Bittiefe wird auch das Grundrauschen verringert. Es könnte auch hilfreich sein, dies in Form einer binären Stichprobe zu betrachten, bei der das niedrigstwertige Bit das Grundrauschen darstellt.

Eine höhere Bittiefe führt daher zu einem höheren Grundrauschen, aber es gibt eine endliche Grenze dafür, wie praktisch dies in der realen Welt ist. Leider gibt es überall Hintergrundgeräusche und damit meine ich nicht, dass der Bus auf der Straße vorbeifährt. Von den Kabeln zu Ihren Kopfhörern, den Transistoren in einem Verstärker und sogar den Ohren in Ihrem Kopf beträgt das maximale Signal-Rausch-Verhältnis in der realen Welt etwa 124 dB, was einer Datenmenge von etwa 21 Bit entspricht.Jargon Buster:

DAC- Ein Digital-Analog-Wandler nimmt digitale Audiodaten auf und wandelt sie in ein analoges Signal um, das an Kopfhörer oder Lautsprecher gesendet wird.

Beispielrate- Gemessen in Hertz (Hz) ist dies die Anzahl der digitalen Datenproben, die jede Sekunde erfasst werden.

SNR- Das Signal-Rausch-Verhältnis ist die Differenz zwischen dem gewünschten Signal und dem Hintergrundgeräusch des Systems. In einem digitalen System ist dies direkt mit der Bittiefe verknüpft.

Zum Vergleich: 16-Bit-Erfassung bietet ein Signal-Rausch-Verhältnis (die Differenz zwischen Signal- und Hintergrundrauschen) von 96,33 dB, während 24-Bit-Erfassung 144,49 dB bietet, was die Grenzen der Hardwareerfassung und der menschlichen Wahrnehmung überschreitet. Ihr 32-Bit-DAC kann also eigentlich immer nur höchstens 21 Bit Nutzdaten ausgeben, und die anderen Bits werden durch Schaltungsrauschen maskiert. In der Realität erreichen die meisten Geräte mit moderaten Preisen ein SNR von 100 bis 110 dB, da die meisten anderen Schaltungselemente ihr eigenes Rauschen verursachen. Offensichtlich scheinen 32-Bit-Dateien schon ziemlich redundant zu sein.

Nachdem wir uns mit den Grundlagen des digitalen Audios vertraut gemacht haben, wollen wir einige der technischeren Punkte erläutern.

Himmelsleiter

Die meisten Probleme im Zusammenhang mit dem Verständnis und der falschen Auffassung von Audio hängen mit der Art und Weise zusammen, in der Bildungsressourcen und Unternehmen versuchen, die Vorteile mithilfe visueller Hinweise zu erklären. Sie haben wahrscheinlich alle gesehen, wie Audio als eine Reihe von Treppenstufen für die Bittiefe und rechteckig aussehende Linien für die Abtastrate dargestellt wurde. Wenn Sie es mit einer glatt aussehenden analogen Wellenform vergleichen, sieht dies sicherlich nicht besonders gut aus. Es ist daher einfach, feiner aussehende, "glattere" Treppen zu finden, um eine genauere Ausgangswellenform darzustellen.

Auch wenn es für die Öffentlichkeit leicht zu verkaufen sein mag, ist diese weit verbreitete Analogie zur Genauigkeit der Treppen eine große Fehlleitung, und es wird nicht erkannt, wie digitales Audio tatsächlich funktioniert. Ignoriere es.

Diese visuelle Darstellung stellt jedoch die Funktionsweise von Audio falsch dar. Die Daten unterhalb der Nyquist-Frequenz, also der Hälfte der Abtastrate, wurden zwar möglicherweise unordentlich angezeigt, sind jedoch perfekt erfasst und können perfekt reproduziert werden. Stellen Sie sich vor, dass wir selbst bei der Nyquist-Frequenz, die oft als Rechteckwelle und nicht als glatte Sinuswelle dargestellt wird, genaue Daten für die Amplitude zu einem bestimmten Zeitpunkt haben, was alles ist, was wir brauchen. Wir Menschen betrachten fälschlicherweise oft den Raum zwischen den Proben, aber ein digitales System funktioniert nicht auf die gleiche Weise.

Die Bittiefe ist oft mit der Genauigkeit verbunden, definiert jedoch das Systemrauschverhalten. Mit anderen Worten das kleinste nachweisbare oder reproduzierbare Signal.

Bei der Wiedergabe kann dies aufgrund des leicht verständlichen Konzepts von DACs mit „Halten nullter Ordnung“, die einfach mit einer festgelegten Abtastrate zwischen den Werten wechseln und ein schrittweises Ergebnis erzielen, etwas schwieriger werden. Dies ist eigentlich keine faire Darstellung der Funktionsweise von Audio-DACs. Während wir hier sind, können wir anhand dieses Beispiels beweisen, dass Sie sich sowieso keine Gedanken über diese Treppen machen sollten.

Eine wichtige Tatsache ist, dass alle Wellenformen als Summe mehrerer Sinuswellen, einer Grundfrequenz und zusätzlicher Komponenten bei harmonischen Vielfachen ausgedrückt werden können. Eine Dreieckswelle (oder eine Treppenstufe) besteht aus ungeraden Harmonischen mit abnehmenden Amplituden. Wenn wir also viele sehr kleine Schritte bei unserer Samplerate haben, können wir sagen, dass ein zusätzlicher harmonischer Anteil hinzugefügt wurde, der jedoch bei der doppelten hörbaren Frequenz (Nyquist) und wahrscheinlich bei ein paar Harmonischen darüber liegt. Wir haben also gewonnen Ich kann sie sowieso nicht hören. Darüber hinaus wäre dies mit wenigen Komponenten recht einfach herauszufiltern.

Wenn wir die DAC-Abtastwerte trennen, können wir leicht erkennen, dass unser gewünschtes Signal zusammen mit einer zusätzlichen Wellenform mit der DAC-Abtastrate perfekt dargestellt wird.

Wenn dies zutrifft, sollten wir dies mit einem schnellen Experiment beobachten können. Nehmen wir einen Ausgang direkt von einem einfachen Hold-DAC nullter Ordnung und leiten das Signal durch eine sehr einfache 2nd Tiefpassfilter mit halber Abtastrate bestellen. Ich habe hier eigentlich nur ein 6-Bit-Signal verwendet, damit wir die Ausgabe auf einem Oszilloskop sehen können. Eine 16-Bit- oder 24-Bit-Audiodatei weist sowohl vor als auch nach dem Filtern ein weitaus geringeres Signalrauschen auf.

Ein ziemlich grobes Beispiel, aber das beweist, dass Audiodaten in dieser chaotisch aussehenden Treppe perfekt wiederhergestellt werden.

Und wie durch Zauberei verschwand die Treppenstufe fast vollständig und der Ausgang wird „geglättet“, nur durch die Verwendung eines Tiefpassfilters, der unseren Sinuswellenausgang nicht beeinträchtigt. In Wirklichkeit haben wir nur Teile des Signals herausgefiltert, die Sie ohnehin nicht gehört hätten. Das ist wirklich kein schlechtes Ergebnis für vier zusätzliche Komponenten, die grundsätzlich kostenlos sind (zwei Kondensatoren und zwei Widerstände kosten weniger als 5 Pence), aber es gibt tatsächlich ausgefeiltere Techniken, mit denen wir dieses Rauschen noch weiter reduzieren können. Besser noch, diese sind standardmäßig in den meisten hochwertigen DACs enthalten.

Mit einem realistischeren Beispiel wird jeder DAC zur Verwendung mit Audio auch einen Interpolationsfilter aufweisen, der auch als Upsampling bezeichnet wird. Die Interpolation ist ganz einfach eine Methode zur Berechnung von Zwischenpunkten zwischen zwei Abtastwerten. Ihr DAC führt also tatsächlich einen Großteil dieser „Glättung“ aus, und zwar weitaus mehr als eine Verdoppelung oder Vervierfachung der Abtastrate. Besser noch, es belegt keinen zusätzlichen Dateibereich.

Interpolationsfilter, die normalerweise in einem DAC verwendet werden, der sein Salz wert ist, sind eine viel bessere Lösung als das Mitführen von Dateien mit höheren Abtastraten.

Die Methoden, um dies zu tun, können recht komplex sein, aber im Wesentlichen ändert Ihr DAC seinen Ausgabewert viel häufiger, als es die Abtastfrequenz Ihrer Audiodatei vermuten lässt. Dadurch werden die nicht hörbaren Oberschwingungen der Treppenstufen weit außerhalb der Abtastfrequenz verschoben, sodass langsamere, leichter erreichbare Filter mit weniger Welligkeit verwendet werden können, wodurch die tatsächlich zu hörenden Bits erhalten bleiben.

Wenn Sie neugierig sind, warum wir diesen Inhalt entfernen möchten, den wir nicht hören können, liegt der einfache Grund darin, dass das Wiedergeben dieser zusätzlichen Daten in der Signalkette, beispielsweise in einem Verstärker, Energie verschwenden würde. Abhängig von anderen Komponenten im System kann dieser höherfrequente „Ultraschall“ -Inhalt tatsächlich zu höheren Intermodulationsverzerrungen in Komponenten mit begrenzter Bandbreite führen. Daher würde Ihre 192-kHz-Datei wahrscheinlich mehr Schaden als Nutzen anrichten, wenn tatsächlich Ultraschallinhalte in diesen Dateien enthalten wären.

Wenn weitere Beweise erforderlich sind, zeige ich auch eine Ausgabe eines hochwertigen DAC mit dem Circus Logic CS4272 (siehe Abbildung oben). Der CS4272 verfügt über einen Interpolationsabschnitt und einen steilen Ausgangsfilter. Alles, was wir für diesen Test tun, ist die Verwendung eines Mikrocontrollers, um den DAC mit zwei 16-Bit-High- und -Low-Samples bei 48 kHz zu versorgen, wodurch wir die maximal mögliche Ausgangswellenform bei 24 kHz erhalten. Es werden keine anderen Filterkomponenten verwendet, diese Ausgabe kommt direkt vom DAC.

Das 24-kHz-Ausgangssignal (oben) von dieser DAC-Komponente in Studioqualität sieht mit Sicherheit nicht wie die rechteckige Wellenform aus, die mit dem üblichen Marketingmaterial verbunden ist. Die Abtastrate (Fs) wird am unteren Rand des Oszilloskops angezeigt.

Beachten Sie, dass die Ausgangssinuswelle (oben) genau halb so schnell ist wie der Frequenztakt (unten). Es gibt keine merklichen Treppenstufen und diese sehr hochfrequente Wellenform sieht fast wie eine perfekte Sinuswelle aus, nicht wie eine blockartig aussehende Rechteckwelle, die das Marketingmaterial oder sogar ein gelegentlicher Blick auf die Ausgabedaten vermuten lässt. Dies zeigt, dass die Nyquist-Theorie auch mit nur zwei Samples in der Praxis einwandfrei funktioniert und wir eine reine Sinuswelle ohne zusätzlichen harmonischen Anteil ohne große Bittiefe oder Samplerate erzeugen können.

Die Wahrheit über 32-Bit und 192 kHz

Wie bei den meisten Dingen steckt hinter all dem Jargon etwas Wahres, und 32-Bit-192-kHz-Audio hat einen praktischen Nutzen, nur nicht in der Handfläche. Diese digitalen Attribute sind praktisch, wenn Sie sich in einer Studioumgebung befinden. Daher wird behauptet, dass Audio in Studioqualität für Mobilgeräte verfügbar ist. Diese Regeln gelten jedoch nicht, wenn Sie den fertigen Titel in die Tasche stecken möchten.

Beginnen wir zunächst mit der Abtastrate. Ein häufig angepriesener Vorteil von Audio mit höherer Auflösung ist die Speicherung von Ultraschalldaten, die Sie nicht hören können, die aber die Musik beeinflussen. Abfälle, die meisten Instrumente fallen weit vor den Frequenzgrenzen unseres Gehörs ab, das Mikrofon, mit dem ein Leerlauf bei maximal 20 kHz aufgezeichnet wurde, und Ihre Kopfhörer, die Sie verwenden, reichen mit Sicherheit auch nicht so weit. Selbst wenn sie es könnten, können Ihre Ohren es einfach nicht erkennen.

Die typische menschliche Hörempfindlichkeit erreicht einen Spitzenwert bei 3 kHz und beginnt nach 16 kHz schnell abzufallen.

Die 192-kHz-Abtastung ist jedoch sehr nützlich, um das Rauschen (dieses Schlüsselwort noch einmal) beim Abtasten von Daten zu reduzieren, den Aufbau wesentlicher Eingangsfilter zu vereinfachen und auch für digitale Hochgeschwindigkeitseffekte wichtig. Überabtastung oberhalb des hörbaren Spektrums ermöglicht es uns, das Signal zu mitteln, um das Grundrauschen zu senken. Sie werden feststellen, dass die meisten guten ADCs (Analog-Digital-Wandler) heutzutage über 64-Bit-Überabtastung oder mehr verfügen.

Jeder ADC muss außerdem Frequenzen über dem Nyquist-Grenzwert entfernen, da sonst ein schreckliches Aliasing auftritt, wenn höhere Frequenzen in das hörbare Spektrum „heruntergefaltet“ werden. Ein größerer Abstand zwischen unserer 20-kHz-Filter-Eckfrequenz und der maximalen Abtastrate ist für Filter der realen Welt besser geeignet, die einfach nicht so steil und stabil sein können wie die theoretischen Filter, die benötigt werden. Dies gilt auch für den DAC, aber wie bereits erwähnt, kann Intermodulation dieses Rauschen zur einfacheren Filterung sehr effektiv auf höhere Frequenzen bringen.

Je steiler der Filter, desto mehr Welligkeit im Durchlassbereich. Durch Erhöhen der Abtastrate können "langsamere" Filter verwendet werden, wodurch ein flacher Frequenzgang im hörbaren Durchlassbereich erhalten bleibt.

Im digitalen Bereich gelten ähnliche Regeln für Filter, die häufig im Studiomix verwendet werden. Höhere Abtastraten ermöglichen steilere, schneller wirkende Filter, die zusätzliche Daten benötigen, um richtig zu funktionieren. Bei der Wiedergabe und bei den DACs ist nichts davon erforderlich, da wir nur an dem interessiert sind, was Sie tatsächlich hören können.

Wenn Sie auf 32-Bit umsteigen, wird jeder, der jemals versucht hat, eine remote komplexe Mathematik zu programmieren, die Bedeutung der Bittiefe sowohl für Ganzzahl- als auch für Gleitkommadaten verstehen. Wie wir bereits besprochen haben, ist das Rauschen umso geringer, je mehr Bits vorhanden sind. Dies ist dann von größerer Bedeutung, wenn Signale im digitalen Bereich aufgrund von Rundungsfehlern geteilt oder subtrahiert werden und wenn beim Multiplizieren oder Addieren Beschneidungsfehler vermieden werden sollen.

Eine zusätzliche Bittiefe ist wichtig, um die Integrität eines Signals bei der Ausführung von mathematischen Operationen, z. B. in Studio-Audiosoftware, zu gewährleisten. Aber wir können diese zusätzlichen Daten wegwerfen, sobald das Mastering beendet ist.

Angenommen, wir nehmen ein 4-Bit-Sample und unser aktuelles Sample ist 13, also 1101 in binärer Form. Versuchen Sie nun, dies durch vier zu teilen, und wir haben 0011 oder einfach 3 übrig. Wir haben die zusätzlichen 0,25 verloren, und dies stellt einen Fehler dar, wenn wir versuchten, zusätzliche Berechnungen durchzuführen oder unser Signal wieder in eine analoge Wellenform umzuwandeln.

Diese Rundungsfehler äußern sich in sehr geringen Verzerrungen oder Rauschen, die sich über eine große Anzahl mathematischer Funktionen ansammeln können. Wenn wir dieses 4-Bit-Beispiel jedoch um zusätzliche Informationsbits für die Verwendung als Fraktion oder Dezimalpunkt erweitern, können wir dank der zusätzlichen Datenpunkte noch viel länger teilen, addieren und multiplizieren. In der Praxis hilft das Abtasten mit 16 oder 24 Bit und das anschließende Konvertieren dieser Daten in ein 32-Bit-Format zur erneuten Verarbeitung, Rauschen und Verzerrungen zu vermeiden. 32-Bit ist, wie bereits erwähnt, eine Menge von Genauigkeitsmerkmalen.

Gleichermaßen wichtig ist zu erkennen, dass wir diesen zusätzlichen Spielraum nicht benötigen, wenn wir wieder in den analogen Bereich zurückkehren. Wie wir bereits besprochen haben, sind etwa 20 Bit Daten (-120 dB Rauschen) das absolute Maximum, das möglicherweise erkannt werden kann, sodass wir trotz der Tatsache, dass es sich um „Audiophile“ handelt, zu einer angemesseneren Dateigröße zurückkehren können, ohne die Audioqualität zu beeinträchtigen wahrscheinlich beklagen diese verlorenen Daten.

Beim Verschieben auf eine niedrigere Bittiefe treten jedoch zwangsläufig Rundungsfehler auf, sodass es immer zu einer sehr geringen zusätzlichen Verzerrung kommt, da diese Fehler nicht immer zufällig auftreten. Während dies bei 24-Bit-Audio kein Problem darstellt, da es bereits weit über das analoge Grundrauschen hinausgeht, löst eine Technik namens "Dithering" dieses Problem bei 16-Bit-Dateien.

Ein beispielhafter Vergleich der durch Trunkierung und Dithering verursachten Verzerrung.

Dies geschieht durch Randomisierung des niedrigstwertigen Bits des Audio-Samples, um Verzerrungsfehler zu vermeiden, wobei jedoch ein sehr leises zufälliges Hintergrundrauschen eingeführt wird, das über die Frequenzen verteilt ist. Obwohl das Einführen von Rauschen möglicherweise als nicht intuitiv empfunden wird, reduziert dies das Ausmaß der hörbaren Verzerrung aufgrund der Zufälligkeit. Durch die Verwendung spezieller rauschförmiger Dithering-Muster, die den Frequenzgang des menschlichen Ohrs missbrauchen, kann 16-Bit-Dithering-Audio tatsächlich ein wahrgenommenes Grundrauschen von nahezu 120 dB beibehalten, genau an den Grenzen unserer Wahrnehmung.

32-Bit-Daten und 192-kHz-Abtastraten haben im Studio erhebliche Vorteile, aber für die Wiedergabe gelten nicht dieselben Regeln.

Einfach gesagt, lassen Sie die Studios ihre Festplatten mit diesem hochauflösenden Inhalt verstopfen. Wir brauchen einfach nicht all diese überflüssigen Daten, wenn es um qualitativ hochwertige Wiedergabe geht.

Einpacken

Wenn Sie immer noch bei mir sind, sollten Sie diesen Artikel nicht als völlige Ablehnung der Bemühungen zur Verbesserung der Audiokomponenten von Smartphones interpretieren. Auch wenn die Nummerierung nutzlos sein mag, sind qualitativ hochwertigere Komponenten und ein besseres Schaltungsdesign immer noch eine hervorragende Entwicklung auf dem Mobilfunkmarkt. Wir müssen nur sicherstellen, dass die Hersteller ihre Aufmerksamkeit auf die richtigen Dinge lenken. Der 32-Bit-DAC des LG V10 klingt zum Beispiel erstaunlich, aber Sie müssen sich nicht mit riesigen Audiodateigrößen herumschlagen, um davon zu profitieren.

Die Möglichkeit, Kopfhörer mit niedriger Impedanz anzusteuern, einen möglichst geringen Geräuschpegel vom DAC bis zur Buchse beizubehalten und eine minimale Verzerrung zu erzielen, ist für die Audiowiedergabe auf Smartphones weitaus wichtiger als die theoretisch unterstützte Bittiefe oder Abtastrate auf diese Punkte wird in Zukunft noch näher eingegangen.

amung und LG ind zwei monolithiche Unternehmen in ihrer Heimat üdkorea. Beide Unternehmen haben ihre Flaggchiff-Handy für da erte Halbjahr 2019 vorgetellt, zunächt amung mit dem Galaxy ...

Da amung Galaxy 10 wird mit ziemlicher icherheit eine der meitverkauften Handy de Jahre 2019 ein. E wird auch eine der teuerten ein, aber wa wäre, wenn e ein Premium-martphone geben würde, d...

Faszinierende Artikel