Ankündigung

Einklappen
Keine Ankündigung bisher.

MP3 auf dem Prüfstand

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • pico
    Registrierter Benutzer
    • 14.09.2004
    • 894

    MP3 auf dem Prüfstand

    Hi,

    im März 2006 gabe s ja einen Hörvergleich zwischen MP3 und CD (an dem ich u.a. auch teilgeniommen habe)
    http://www.visaton.de/vb/showpost.ph...72&postcount=1

    Vor kurzem habe ich mich des Themas mal objektiv angenommen, also das Original mit der dekodierten und wieder enkodierten Version verglichen (Amplitudenstatistik und Spektrum). Das Ergebnis hat mich doch stark überrascht, s. MP3 auf dem Prüfstand
    Gruß Pico

    <<< Studieren UND Probieren >>>
  • Chaomaniac
    Registrierter Benutzer
    • 01.08.2008
    • 2916

    #2
    Ich kenn mich mit den Einstellungsbezeichnungen von LAME nicht so wirklich aus und es geht aus dem Artikel auch nicht hervor:
    Gewandelt wurde ein Wave-file von CD (44.1 kHz/16 Bit) in MP3-Files, dann wieder zurück in Wave-Files 44.1 kHz/16 Bit?
    Mit welchen Sampleraten wurden die verschiedenen MP3s getaktet?
    Gaaaanz viel Zeug zu verkaufen...

    Kommentar

    • pico
      Registrierter Benutzer
      • 14.09.2004
      • 894

      #3
      Hi Chaomaniac,

      Ich kenn mich mit den Einstellungsbezeichnungen von LAME nicht so wirklich aus und es geht aus dem Artikel auch nicht hervor:
      nach etwa 1/3 des Textes kommt unter 3. eine Tabelle in der die Kommandozeilenparameter von LAME explizit aufgelistet sind (ganz linke Spalte). In der 3. Spalte von rechts steht, ob ein Resampling gemacht wurde (bei 96 und 64 kB/sec wird das automatisch gemacht).

      Damit ist die Vorgehensweise perfekt dokumentiert und kann von jedem (der aufmerksam lesen kann) nachvollzogen werden.

      Der Artikel kann keine allgemeingültige Lösung anbieten sondern will nur auf die grundlegende Problematik von MP3, OGG, WMA, AAC und wie sie alle heißen hinweisen. Mit der vorgestellten Strategie kann jeder das selber überprüfen (zumindest das Programm WaveAnal.exe ist Freeware, die spektrale Analyse mit WaveAnalSpec ist nicht zwingend notwendig).
      Gruß Pico

      <<< Studieren UND Probieren >>>

      Kommentar

      • Chaomaniac
        Registrierter Benutzer
        • 01.08.2008
        • 2916

        #4
        Hi Pico,
        Ich gehe jetzt einfach mal davon aus, dass es sich beim "Rohmaterial" um eine 44,1/16er Wave Datei von CD Handelt, auch wenn Du mir die Beantwortung dieser Frage verwehrt hast.
        Auch beim aufmerksamen Lesen mag es für einige nicht ganz eindeutig sein, was diese easy to understand-Kommandozeilenparameter erzählen. Eine Erklärung für Dummies bleibt aber leider aus...
        Meine Frage bezüglich der Sampleraten bezog sich auch auf die Taktung der entstehenden MP3-Files und nicht, ob die Urprungsdatei vor dem Wandeln irgendwie resampled wurde. So liest es sichnämlich für mich bei der Angabe der Eingabeparameter.

        An Deiner eigentlichen Testmethode ist so weit auch nix auszusetzen, aber:
        Wäre es in diesem Zusammenhang nicht interessant, einen kurzen Sample in MP3 zu rippen, diesen aber nicht wieder zurück zum 44,1/16er Format zu wandeln, sondern in was deutlich hochauflösenderes (192/24 zum Beispiel)?
        Dann könnte man bei starker Spreizung der Wellenform vielleicht auch graphisch sehen, wie diese Spitzen zustande kommen, die versuchen lauter zu sein als dB/fs und durch ihre abgeschnittene Plateau-Form Verzerrungen erzeugen.
        Gaaaanz viel Zeug zu verkaufen...

        Kommentar

        • pico
          Registrierter Benutzer
          • 14.09.2004
          • 894

          #5
          Hi Chaomaniac,

          Als Teststück haben wir aus der neuen Yello-CD Touch Yello das 4. Stück "Bostich (Reflected)" ausgewählt
          Duirch die CD als Quelle ist 44100 Hz/16 bit vorgegeben, ich hatte nicht angenommen, dass das in Frage gestellt werden könnte (Referenz war 1. WAV (original)). Von "verwehrt" kann nicht die Rede sein.

          Die Kommandozeilenparameter sind mitnichten easy to understand, aber sie sind angegeben. Somit kann man nachvollziehen was gemacht wurde. In der 1. Tabelle wurde versucht die Einstellungen in "Klartext" gegenüber zu stellen, die 2. Tabelle bezieht sich dann über die Kommandozeilenparameter auf die 1. Tabelle (gleiche Reihenfolge bis auf die "dazwischengeschobenen" Originaldateien 1 und 13).

          Meine Frage bezüglich der Sampleraten bezog sich auch auf die Taktung der entstehenden MP3-Files und nicht, ob die Urprungsdatei vor dem Wandeln irgendwie resampled wurde. So liest es sichnämlich für mich bei der Angabe der Eingabeparameter.
          Dann hast Du den Sinn der 1. Tabelle nicht verstanden: in der 1. Spalte stehen die Kommandozeilenparamter und rechts davon was sie bedeuten bzw. BEWIRKEN (ich hatte gehofft das sei für Dummies ausreichend). Bei 96 und 64 kBit/s macht LAME automatisch UNGEFRAGT ein Resampling, damit diese niedrigen Bitraten überhaupt noch vernünftig klingen. ICH habe also gar nichts resampled.

          Wäre es in diesem Zusammenhang nicht interessant, einen kurzen Sample in MP3 zu rippen, diesen aber nicht wieder zurück zum 44,1/16er Format zu wandeln, sondern in was deutlich hochauflösenderes (192/24 zum Beispiel)?
          Dann könnte man bei starker Spreizung der Wellenform vielleicht auch graphisch sehen, wie diese Spitzen zustande kommen, die versuchen lauter zu sein als dB/fs und durch ihre abgeschnittene Plateau-Form Verzerrungen erzeugen.
          1. bringen die 24 bit NACHER nix, da sich das Problem ja im obersten Bit abspielt (24 bit erweitert ja nur die Auflösung nach unten). Durch die Halbierung auf 50% habe ich ja quasi 1 bit Headroom geschaffen der zeigt was passiert (auch da würde 24 bit nix bringein, da die kleinen Werte um 0 in diesem Zusammenhang ja nicht interessieren).
          2. LAME wandelt das MP3-file immer in seine ursprüngliche Abtastrate zurück (wie geschrieben gibt es keine Option bei -decode).

          Ein Upsampling von 44100 Hz auf 192000 Hz ist eine hochgradig schwierige Operation, da es nur eine Näherungslösung gibt (es gibt keinen gradzahligen Bruch X/Y, der 192000 in 44100 überführen würde, und genau das ist bei einem eindeutigen Resampling nötig). Somit wäre das Ergebnis vom Resampling-Näherungs-Algorithmus abhängig - warum sollte ich da eine neue Variable einführen?

          Last but not least: was sollte Dein Vorschlag bringen? Ich will/kann keinen verbesserten LAME schreiben, also bleiben mir nur die verfügbaren Einstellparamter. Die sollte ich nun idealerweise so wählen, dass KEINE Übersteuerung auftritt, oder? Das ist zumindest meine Erkenntis aus der Untersuchung.

          Ich finde es aber schön, wenn Dich unsere "Entdeckung" der digitalen Übersteuerung zu eigenen kritischen Fragen animiert - genua das sollte ja der Sinn des Artikel sein
          Gruß Pico

          <<< Studieren UND Probieren >>>

          Kommentar

          • Chaomaniac
            Registrierter Benutzer
            • 01.08.2008
            • 2916

            #6
            Is nicht wert, dass man was sagt...
            Gaaaanz viel Zeug zu verkaufen...

            Kommentar

            • helli
              Registrierter Benutzer
              • 02.06.2006
              • 877

              #7
              Zitat von pico Beitrag anzeigen
              Ich finde es aber schön, wenn Dich unsere "Entdeckung" der digitalen Übersteuerung zu eigenen kritischen Fragen animiert - genua das sollte ja der Sinn des Artikel sein
              Offenbar hat man gar nicht verstanden, was MP3 ueberhaupt tut.
              Ein grundlegender Aspekt ist die Entfernung von maskierten Frequenzbaendern durch ein psychoakustisches Modell.
              Je nachdem wie die Phasenbeziehung zwischen maskiertem Band und "Rest" ist, wird das Signal leiser oder lauter.
              Im Uebrigen findet die Maskierung im Rahmen der DCT statt (die mit Floating-Point-Praezision berechnet wird) und somit kann das "uebersteuerte" Signal verlustfrei wieder hergestellt werden - das Gesamtsignal wird aber typsicher Weise im Nachhinein auf 16Bit reduziert und dabei zwangslaeufig geclippt.

              Kommentar

              • doctrin
                Registrierter Benutzer
                • 06.05.2006
                • 2786

                #8
                Auch sehr interessant sind manche Kommentare zu diesem Thema:

                hreith schrieb:
                "Soweit mir bekannt ist, wird bei den verlußtbehafteten Methoden der Inhalt codiert, nicht die Signalform. Schon eine einfache, unhörbare Veränderung der Phase kann eine ganz andere Signalform und
                damit ganz andere Pegelspitzen ergeben ohne dass dies irgend etwas am Inhalt ändern würde.
                Da Bänder unter der Hörschwelle weggelassen werden muss das Ergebnis weniger Energie enthalten als das
                Eingangssignal, was dann entweder zu einem geringeren Pegel oder zu einer Pegelanpassung führen müsste.
                Die verlußtbehafteeten Methoden sind nicht eindeutig, sowohl unterschiedliche Coder als auch
                Decoder können zu unterschiedlichen Ergebnissen führen - zaubern kann aber keiner.
                Generell erheben die verlußtbehafteten Methoden ja keinen HighEnd-Anspruch sondern sind eher als Nachfolger der CC
                zu sehen. Diesbezüglich finde ich es sehr erstaunlich mit wie wenig Daten man dennoch über der "Qualität" einer CC landet."
                Bradley Manning verdient den Friedensnobelpreis.

                Rette deine Freiheit . De

                Du bist Terrorist!!!

                Kommentar

                Lädt...
                X