Soundformate | Teil 1: AIFF

Zettt

Doppelter Melonenapfel
Registriert
16.10.05
Beiträge
3.374
atr-aiff-banner.gif


Hallo liebe Leserinnen und Leser,
dies soll eine mehrteilige Reihe über das Thema Datenformate im Audiobereich werden. Formate werden hier vorgestellt und die Sinnhaftigkeit dieser soll alltagstauglich überprüft werden. Zu diesem Zweck wird es immer eine kurze Einführung geben, die Formate werden mit ihren kleinen Besonderheiten vorgestellt und Hörbeispiele werden, wenn nötig, auch eingefügt.

Was sollte man bei der Arbeit mit Audiodateien beachten?
Nun zunächst einmal sollte man sich vor Augen führen, dass wir, die Computernutzer, nur mit digitalem Material zu tun haben.
Was bedeutet das?
Betrachten wir mal die gewöhnliche Schallaufzeichnung eines Instrumentes und dessen tontechnische Weiterverarbeitung in dieser Kette von Effekten, Reglern, Weichen usw.:
  1. Ein Instrument erzeugt Klang
  2. Die Luft wird angereizt zu schwingen und transportiert Schallwellen hin zu einem Mikrofon
  3. Dieses Mikrofon nimmt den Klang analog zu dem sich verändernden Schalldruck auf
  4. Vorbei an den Fingern eines Technikers über besagte Regelstufen hin zu einer, wenn möglich, Bandmaschine.
    Bis hier hin nichts besonderes, aber die Kette ist noch nicht zu Ende, denn bis hier hin hat das Signal keine deutlichen Einbußen, im Sinne von Reduktion, wegstecken müssen. Wir sind bis hierher noch auf der sicheren (analogen) Seite. Doch hier geht es erst auf die Reise.
  5. Unser Instrument wird nun in ein Format gebracht mit dem das CD-Presswerk "etwas anfangen kann", meist wird hier bereits eine Konvertierung in ein digitales, verlustbehaftetes Format vorgenommen. Wahlweise erfolgt hier auch gleich die Formatierung des Signals in ein Dateiformat welches wir dann beispielsweise im iTunes Store herunter laden können.

VERLUSTBEHAFTET? Das klingt schrecklich, ich weiss, aber die CD hatte sich nunmal gegenüber der Schallplatte und später der Kassette durchgesetzt. Heute ist dieses Medium nicht mehr wegzudenken. Deshalb müssen wir uns kurz mal damit auseinander setzen was denn nun überhaupt dran ist an der Reduktion von Daten.
Möchte man ein analoges Signal digital abbilden, so bräuchte man ein Medium, welches unendlich viel Speicherplatz hat. Denn das impliziert analog, zu jedem Punkt muss in der Abbildung dessen ebenfalls ein Punkt existieren - das kennen wir alle noch aus der Schulzeit denke ich.
In einem digitalen System haben wir aber keinen unbegrenzten Speicherplatz, auf einer CD sind es 650MB welche zur Verfügung stehen.
Wie bekommt man nun ein gesamtes Album auf diese, im Vergleich zur Unendlichkeit, winzige Grösse? Man lässt einfach Daten weg. Das klingt auch wieder schrecklich aber Geduld.
Zunächst dachten sich die Techniker, beschränken wir uns bei der Umwandlung doch einmal auf ein gewisses Frequenzspektrum. Laut Nyquist muss ein Signal mindestens doppelt so hoch sein wie das Ursprungssignal um dieses digital umzusetzen. Der Mensch hat ein Hörvermögen von ca. 16-20.000Hz.
Handbuch der Tonstudiotechnik von Michael Dickreiter 6. Auflage Band 1 Seite 110 schrieb:
Nur Schallereignisse mit Frequenzen zwischen 16 und 16.000Hz, maximal 20.000Hz, rufen Hörereignisse hervor.
20kHz, das soll also unser Maximum sein. Das bedeutet nach Nyquist, wir müssen in unserer Wandlungsfrequenz, im weiteren Samplingfrequenz genannt, doppelt so hoch gehen um diese darstellen zu können, ein bisschen Luft nach oben noch und wir landen bei einer Frequenz von 44.100Hz. Diese Zahl habt ihr sicher schon einmal irgendwo gelesen.
Gut, Frequenz umsetzen können wir nun in unserem System. Aber wie sieht es mit der zweiten Komponente aus - der Lautstärke?

DYNAMIKUMFANG: Im Moment wäre der Graph unserer Samplingfrequenz eine relativ flache Angelegenheit. Denn nach dem Gesetz der Schallwelle bedarf es noch einer Komponente um diesen Graphen darstellen zu können.
Bei Wikipedia ist das physikalische Gesetz der Schallgeschwindigkeit zu finden:

3e7c572fe658c79dbcbf8b34df7e32d5.png


Wie oben bereits erwähnt wird die Luft zum schwingen gebracht, Schalldruck baut sich auf. Dies ist also die ideale Möglichkeit für das abgetastete Signal wieder in Form zu kommen.
Wiederum sind wir aber auch hier wieder "nur" digital - das bedeutet eingeschränkt. Rein rechnerisch ergibt sich bei einer Auflösung von 16 Bit ein theoretischer Dynamikumfang von 96dB. Warum das so ist, möchte ich hier nicht weiter erläutern, wir möchten ja schließlich nicht Tontechniker werden, oder doch?

FAZIT Verlustbehaftet bedeutet im Sinne einer CD, dass Daten weg gelassen werden um diese auf dem Datenträger festzuhalten. Klangliche Einbußen sind theoretisch nicht zu verzeichnen. So sind aber die Experten oft der Meinung CDs würden "hart" klingen im Vergleich zu analogen Signalen. Übrigens das Datenformat, welches eine direkte Kopie der Audio-CD darstellt ist auf dem Mac das Haus- und Hof-Format AIFF, AIF, AIFC und auf Windows Rechnern WAV.

Was hat das nun alles mit dem Hausgebrauch zu tun?
Nun, um es einfach zu sagen, sobald eine CD im Laufwerk landet und die Titel darauf 1:1 auf Festplatte gespeichert werden, hat man keine Verluste im Vergleich zu Datenwiedergabe in einem gewöhnlichen CD-Player.
Jetzt kommt aber der Teil an dem der Hund begraben liegt. Meist wollen wir nicht pro Album eines Künstlers 650, respektive 700MB, Festplattenplatz verschenken. Also muss die Musik noch einmal konvertiert werden. In ein noch verlustbehafteteres Format. Etwa MP3 oder MP4/M4A/AAC. Denkt das nächste mal drüber nach, ein armer Tontechniker, dessen Herz eh schon blutet, wird es euch danken.

Zum Schluss noch ein kleiner Hörvergleich
Delicate Piano aus der AppleLoops Bibliothek in verschiedenen Qualitäten:
  • Das Piano in seiner ursprünglichen Qualität
  • Dasselbe mit 8000Hz Samplingfrequenz. Hier kann man deutliche Klangeinbußen ausmachen. Das Material kann vor allem nicht mehr seinen gesamten Tonumfang ausspielen. Laut Nyquist brauchen wir ja die doppelte Samplingfrequenz um richtig abzubilden. Im Umkehrschluss heisst das also mit 8000Hz können nur Signale bis 4000Hz abgebildet werden. Das Klavier klingt dumpf.
  • Zu guter letzt noch mit 8-Bit Dynamik. Diese Version hat jetzt zwar den gesamten Frequenzumfang zurück jedoch klingt diese Aufnahme deutlich verrauscht. Das also macht ein digitales (im übrigen auch ein analoges) Medium welches nicht genügend Dynamik zur Verfügung stellt.
 
Zuletzt bearbeitet:

.holger

Borowitzky
Registriert
13.09.04
Beiträge
8.970
nice.... der Anfang erinnert mich an Bürger Lars Dietrich

[QUOTE="ich bring dich um" von Bürger Lars Dietrich]Der Takt, der dich packt, hackt nackt aus der Box das Geh"r von der
Muschel in den Kopf, durch den Hals aus der Lunge in den Mund, durchden
Schlund auf die Zunge in das Mikro durch das Kabel und zur?ck in dieBox!
Von der Box in die Ohren, von den Ohren in den Mund, mit dem Schlund in
den Magen im K"rperuntergrund, und ab in den Darm und mit Dampf hinten
'raus, aus dem Kerker in das Mikro und dort in den Verst"rker. Vom
Verst"rker in die Box, aus der Box ind die Schnecke, von der Gurgel in die
Pumpe und 'raus mit dem Gelumpe durch die Luft in das Mikro, durch das
Kabel in die Box. Von der Box in den Saal und das Ganze noch einmal.Vom
Sall in die Ohren durch die Muschel um die Exke, von der Nase in die Stirn
und durch die Sch"deldecke, dann ab in den Raum und von dort insMikrofon
in das Kabel von der Box:[/QUOTE]
 

Mac Patric

Ribston Pepping
Registriert
13.04.05
Beiträge
294
Super Idee.

Freu mich schon auf die Fortsetzung.

MP
 

streuobstwiese

Schafnase
Registriert
11.03.05
Beiträge
2.238
Sehr schön Andreas, ich habe da natürlich noch ein paar wirklich kleine Anmerkungen:
- In dem Satz mit dem Nyquist-Link sollte es anstatt "Signal" Abtastfrequenz o.ä. heissen.
- In dem Satz danach über das Hörvermögen ist ein Tippfehler.( 16 - 20000).
- Den letzten Satz vor dem Absatz "Dynamikumfang" finde ich seltsam, weil nach meiner Meinung Lautstärke nur in der analogen Welt existiert. Im digitale wäre das auch die Dynamik oder der Dynamikumfang.
Wie gesagt, nur Kleinigkeiten, ich freue mich jetzt schon auf die nächsten Folgen.:)
p.s. ist eigentlich meine PN bei dir angekommen?:oops:
 
  • Like
Reaktionen: Zettt

Zettt

Doppelter Melonenapfel
Registriert
16.10.05
Beiträge
3.374
Ja hab ich. Aber die ist ja soooo lang. Aber danke dir für deine Hilfe. Das ist mal viel Input.

Zu deinem Einwand mit der Dynamik.
Wie erklär ich das jetzt so wie ich's meine?
Das Signal hat ja trotzdem Dynamik und die Dynamik kann man ja gleichsetzen mit der Lautstärke. (Wie war das nochmal mit dB FS und dB SPL?)
dB SPL beschreibt ja einen Lautstärkewert und man kann von einem dB ins andere Rechnen bis man bei dB FS angekommen ist. (dB SPL > dB U oder dB I > dB FS - zeichnet man die Gitarre über Mikro direkt digital auf)
 

Cyrics

Neuer Berner Rosenapfel
Registriert
01.04.05
Beiträge
1.973
Hier sei auch noch die Abtastfrequenz nach Nyquist verlinkt, die hier angeschnitten wurde.
Das menschliche Ohr kann Frequenzen von 20 Hz bis (sehr grob) 20 kHz hören. Viele steigen schon bei 15-16 kHz aus. 20 kHz können eigentlich nur noch Menschen hören, die noch nie einer hohen Lautstärke ausgesetzt waren wie Disco oder dergleichen. Aber bei diesem Thema streiten eh alle Wissenschaftler miteinander, was nun die wahren Werte sein sollen. Es variiert eben von Mensch zu Mensch...

ich hab jetzt auch etwas vermisst... nämlich die Erklärung für AIFF?!
Es fehlt mir irgendwie der Satz, der klar heraussstellt, dass AIFF eben die Intention hat, dass ein Verlust von Frequenzen entgegen gewirkt wird und soviel wie möglich mitübertragen wird. MP3 und Co. dagegen konzentrieren sich auf den Weg Daten wegzulassen, also die Frequenzen außerhalb des hörbaren Bereiches förmlich abzuschneiden.

Ich bin gespannt auf den Rest der Formate. Vor allem OGG und Co.
 

PatrickB

Rhode Island Greening
Registriert
29.10.05
Beiträge
478
Ich stimme Cyrics zu, hier geht es nicht um das Dateiformat AIFF. Das ist eher ein Crashcours Sampling. Auch gut, aber hal falscher Titel dafür. Hätte mir eher Details über das Dateiformat selber gewünscht. Und wenn man schon son Digitalem Audio redet würde ich auch die ganzen Vorteile nennen zur Analogen Tonquelle; Verlustfreie Übertragung, Verlustfreie Vervielfältigung, und somit die Möglichkeit die (Digitale) Aufnahme durch ständiges kopieren im Originalzustand über Jahrtausende zu behalten.

Aber find die Rubrik an sich gut! Und Hut ab, so Texte zu schreiben ist immer mit viel Aufwand verbunden.

Versuch mal die Sätze immer etwas auseinanderzubröseln. Mit Punkten liest sich sowas besser als mit Kommas. (lange Sätze in mehrere abgeschlossene Sätze teilen)

Freue mich auf einen Vergleich von Loslessformaten! (Wink mit dem Zaunpfahl)
 

streuobstwiese

Schafnase
Registriert
11.03.05
Beiträge
2.238
Ja hab ich. Aber die ist ja soooo lang. Aber danke dir für deine Hilfe. Das ist mal viel Input.

Zu deinem Einwand mit der Dynamik.
Wie erklär ich das jetzt so wie ich's meine?
Das Signal hat ja trotzdem Dynamik und die Dynamik kann man ja gleichsetzen mit der Lautstärke. (Wie war das nochmal mit dB FS und dB SPL?)
dB SPL beschreibt ja einen Lautstärkewert und man kann von einem dB ins andere Rechnen bis man bei dB FS angekommen ist. (dB SPL > dB U oder dB I > dB FS - zeichnet man die Gitarre über Mikro direkt digital auf)
Ohne jetzt hier ins Detail gehen zu wollen (weil langweilig) müssen wir aufpassen, dass wir die vielen verschiedenen Begriffe nicht vermischen. dB beschreibt ja immer nur ein Verhältnis zu einer Bezugsgröße. Deswegen arbeite ich auch lieber mit den deutschen Begriffen. Dynamik und Lautstärke kann man nicht gleichsetzen. Dynamik ist in analogen Systemen durch die Signalkette beschränkt und den Prozentsatz an Verzerrung, die man maximal tolerieren will. In der digitale Ebene ist die Dynamik erstmal durch die Auflösung in Bit begrenzt.
Lautstärke hängt nur von der Verstärkung nach der D/A-Wandlung ab.
 
Zuletzt bearbeitet:

Marja

Oberösterreichischer Brünerling
Registriert
07.08.06
Beiträge
708
Herzlichen Dank Zettt!

Vieles von deinem Beitrag war mir so noch nicht bewusst.

Nun werde ich vor jedem Umwandeln einer CD in itunes
einen Gedanken an alle Tontechniker senden.

Ciao Marja
 

Hallo

Gast
Unabhängig von den technischen Ergebnissen und den hörbaren Klangeigenschaften von der CD und auch in der Weiterführung der komprimierten Formate, gab es an der Hochschule für Musik und Darstellenden Kunst (Frankfurt am Main) eine wissenschaftliche Untersuchung, ( http://www.stereophile.com/features/203/index.html ) die mit Hilfe von psychologischen Emotionsfragebögen etc. feststellte, dass es zu dem hörbaren Klang eine emotionale Ebene gibt, die anscheinend auf Datenreduktion und damit auch auf die CD negativ reagiert.
 

Peter Maurer

Pommerscher Krummstiel
Registriert
16.03.04
Beiträge
3.077
Es fehlt mir irgendwie der Satz, der klar heraussstellt, dass AIFF eben die Intention hat, dass ein Verlust von Frequenzen entgegen gewirkt wird [...]
Ich stimme Cyrics zu, hier geht es nicht um das Dateiformat AIFF. Das ist eher ein Crashcours Sampling. Auch gut, aber hal falscher Titel dafür. Hätte mir eher Details über das Dateiformat selber gewünscht.
Aber ist die Tiefpassfilterung nicht gerade das Charakteristikum des AIFF-Formats im Vergleich zu einer gedachten perfekten analogen Aufnahme?

AIFF wirkt dem Verlust von Frequenzen deshalb nicht entgegen, sondern laesst bestimmte Frequenzen ganz gezielt weg. Man koennte auch sagen: Das Tonsignal wird geglaettet, was z.B. auch den von Hallo erwaehnten Effekt erklaeren koennte. Erst ab diesem Zeitpunkt, d.h. in der weiteren Verarbeitung, ist das Format dann verlustfrei; und das ist der Vorteil gegenueber MP3 und Konsorten.

Diese beiden Eigenschaften (Reduktion der Datenmenge durch Sampling und damit verbundener einmaliger Informationsverlust) sind m.E. die wichtigsten Merkmale des AIFF-Formats, und beides liess sich aus Zettts Beschreibung doch ganz schoen herauslesen. Und wenn ich bedenke, dass dies hier erst Teil 1 einer Serie ist, dann vermute ich, dass dieser Artikel als Grundstein gedacht war -- gleichsam als Erklaerung der "Rohdaten", die der Mac-Nutzer sieht, wenn er eine CD in sein Laufwerk schiebt und diese dann mit dem Finder betrachtet. Und jetzt geht's wahrscheinlich bald mit den verlustbehafteten/-freien Kompressionsmethoden weiter.

Oder will wirklich jemand wissen, was genau in welcher Reihenfolge in solchen Dateien drinsteht? Dann hier entlang, aber das haette ich an Zettts Stelle auch nicht genauer erklaert.
 

yjnthaar

Schwabenkönig
Registriert
07.06.04
Beiträge
2.657
Mich würde die Spannungssynapse in der Mittelschwingung eines mitteltönigen Sprachfrequenzganges bei 100 dB Schalldruckpegel interessieren und wie hoch der Rauschabstand zwischen den Ohren effektiv beträgt. :-D
 

LuxusLux

Rheinischer Krummstiel
Registriert
13.07.06
Beiträge
386
Gratuliere zu diesem schicken Artikel. :-D

Ich muss zugeben, dass mich ein bissl verwundert (ohne bösartige Kritik loszuwerden), dass dieser Text trotz eines trockenen Themas absolut fesselnd geschrieben wurde. :oops: Das habe ich bei der gestrigen redaktionellen Fleissarbeit ein wenig vermisst. o_O

Wird es einen Wettkampf geben: Journalistenanwärter (Riesenzwerg) vs. Tontechniker (Zettt)? o_O ;)

Ist wirklich nicht böse gemeint.

Tolle Arbeit Zettt!
 

PatrickB

Rhode Island Greening
Registriert
29.10.05
Beiträge
478
Diese beiden Eigenschaften (Reduktion der Datenmenge durch Sampling und damit verbundener einmaliger Informationsverlust) sind m.E. die wichtigsten Merkmale des AIFF-Formats, und beides liess sich aus Zettts Beschreibung doch ganz schoen herauslesen.

Ja aber ist der Tiefpassfilter nicht ein Merkmal des AD Wandelvorganges? Der Tiefpassfilter ist ja meines Wissens noch eine Analoge Komponente vor dem eigentlichen Wandler (bin aber kein Elektrotechniker, aber meines Wissens halt). Somit ist er ja keine Eigenschaft des AIFF-Formats, sondern eine Eigenschaft von allen digitalen Audioformaten (auch anderen unkomprimierten wie WAV, SD2 oder anderen …) oder Strömen (wie z.B. in Digitalen Effektgeräten; da kann man ja nicht von AIFF Dateien sprechen … )

Ich find ja alles gut was Zettt geschrieben hat nur find ich den Titel unpassend. PCM-Formate oder "Grundlagen des Samplings" hätte ich halt irgendwie passender gefunden, aber schlagt und straft mich.
 
Zuletzt bearbeitet:

Peter Maurer

Pommerscher Krummstiel
Registriert
16.03.04
Beiträge
3.077
Ja aber [...] keine Eigenschaft des AIFF-Formats, sondern eine Eigenschaft von allen digitalen Audioformaten [...]
Stimmt schon. Mir kommt da wahrscheinlich mein Programmierertum in die Quere -- ich seh' das naemlich objektorientiert: AIFF uebernimmt den Tiefpass vom vorgelagerten Prozess (Sampling), und damit ist der Tiefpass auch eine Eigenschaft dieses Formats, wenn auch eine ererbte.

Sonst tut das AIFF-Format halt nicht viel, ausser der im oben verlinkten Artikel geschilderten Festlegung solcher Konventionen wie Chunk-Anordnung, Kanal-Interleaving, und so weiter. Furchtbar staubig, diese Sachen, und m.E. fuer die meisten hier ziemlich uninteressant. :D

In der echten Welt wuerd's mich nicht wundern, wenn Tonstudios erstmal mit hoeheren Abtastraten arbeiteten. Eine handelsuebliche AIFF-Datei koennte insofern auch durchaus mehrere Bandpassfilter hinter sich haben. Wie ist denn das, Zettt?
 

Hallo

Gast
Aber ist die Tiefpassfilterung nicht gerade das Charakteristikum des AIFF-Formats im Vergleich zu einer gedachten perfekten analogen Aufnahme?

AIFF wirkt dem Verlust von Frequenzen deshalb nicht entgegen, sondern laesst bestimmte Frequenzen ganz gezielt weg. Man koennte auch sagen: Das Tonsignal wird geglaettet, was z.B. auch den von Hallo erwaehnten Effekt erklaeren koennte. Erst ab diesem Zeitpunkt, d.h. in der weiteren Verarbeitung, ist das Format dann verlustfrei; und das ist der Vorteil gegenueber MP3 und Konsorten.

Diese beiden Eigenschaften (Reduktion der Datenmenge durch Sampling und damit verbundener einmaliger Informationsverlust) sind m.E. die wichtigsten Merkmale des AIFF-Formats, und beides liess sich aus Zettts Beschreibung doch ganz schoen herauslesen. Und wenn ich bedenke, dass dies hier erst Teil 1 einer Serie ist, dann vermute ich, dass dieser Artikel als Grundstein gedacht war -- gleichsam als Erklaerung der "Rohdaten", die der Mac-Nutzer sieht, wenn er eine CD in sein Laufwerk schiebt und diese dann mit dem Finder betrachtet. Und jetzt geht's wahrscheinlich bald mit den verlustbehafteten/-freien Kompressionsmethoden weiter.

Oder will wirklich jemand wissen, was genau in welcher Reihenfolge in solchen Dateien drinsteht? Dann hier entlang, aber das haette ich an Zettts Stelle auch nicht genauer erklaert.

Warum datenreduzierte Musik in der Untersuchung für die Probanden nerviger war wird leider nicht erklärt.
Eine Erklärung könnte jedoch sein, dass das Gehirn, welches Klänge speichern kann, diese im Sinne der Gestaltgesetzte immer wieder zu einem "gelernten" vollen Ton addiert. Also je datenreduzierter die Musik, um so mehr Sinnesleistung des Gehirns, was ja auf Dauer anstrengend sein kann.
In einem musikwissenschaftlichen Institut in Dresden, wurden mal Untersuchungen mit Differenz-EEGs gemacht, die zu ähnlichen Ergebnissen kommen (habe da leider keinen Link mehr).

Vergessen bei meinem ersten Post, sehr schöner Artikel von Zettt:)
 

Zettt

Doppelter Melonenapfel
Registriert
16.10.05
Beiträge
3.374
Ohne jetzt hier ins Detail gehen zu wollen (weil langweilig)
Ja mir ist inzwischen auch bewusst geworden was dich glaube ich daran gestört hat. Eher die Tatsache das ich den Begriff Lautstärke missbraucht habe um Dynamik in den Sprachschatz der Leser einzuführen?
 

Zettt

Doppelter Melonenapfel
Registriert
16.10.05
Beiträge
3.374
Mich würde die Spannungssynapse in der Mittelschwingung eines mitteltönigen Sprachfrequenzganges bei 100 dB Schalldruckpegel interessieren und wie hoch der Rauschabstand zwischen den Ohren effektiv beträgt. :-D
Naja sagen wir mal so, ist zwischen den beiden Ohren genug schalldämmendes Material (Stroh) vorhanden geht der SNR (Signal-Rausch-Abstand) gegen unendlich. :-D
 

Zettt

Doppelter Melonenapfel
Registriert
16.10.05
Beiträge
3.374
[...] -- gleichsam als Erklaerung der "Rohdaten", die der Mac-Nutzer sieht, wenn er eine CD in sein Laufwerk schiebt und diese dann mit dem Finder betrachtet.[...]
Exakt! Wenigstens einer versteht mich. ;)

Und wie streuobstwiese Christian eben schon sagte wollte ich keinen Menschen langweilen. Wie das Format im genauen aussieht interessiert ja keine alte Sau keinen normalen Menschen. Ich schreibe ja hier für normale Menschen nicht für ein Fachpublikum. Wenn hier weiterführende Links gepostet werden. Kein Thema lasst euch nur aus.
Aber ich dachte mir eben mach ich mal bisschen Tontechnik für jedermann.
Und das habe ich scheinbar geschafft.