Ankündigung

Einklappen
Keine Ankündigung bisher.

Quefrencys und Rahmonics im Cepstrum liftern :-)

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • ropf
    Registrierter Benutzer
    • 02.12.2013
    • 841

    Quefrencys und Rahmonics im Cepstrum liftern :-)

    ... nein, kein Kauderwelsch - sondern eine Form der spektralen Analyse, die älter ist als die FFT - und die manches Hörbare sichtbar macht, das im normalen Spektrum oder in einer Impulsantwort nicht erkennbar ist.

    Diese Technik hat breite Anwendung zB. in der Sprachanalyse und und in akustischen Diagnosetechniken im Maschienenbau gefunden - im (Selbst-)Lautsprecherbau bisher eher weniger. Hier einige Links zu diesem spannenden Thema:
    .

    Accourate-Besitzer können sich freuen - es hat diese Funktion wohl schon eingebaut. Hier ein Thread dazuim Aktives-Hören-Forum. Der Rest von uns muss sich wohl in Matlab oder Octave fitmachen

    Bin gespannt, was ihr dazu sagt - oder ob jemand schon damit Erfahrungen hat.

    Und bitte Religionsfragen und philantropischen Betrachtungen draussen lassen
    Zuletzt geändert von ropf; 21.01.2015, 08:26. Grund: Fehlenden Link ergänzt
  • blaueelise
    Registrierter Benutzer
    • 22.10.2012
    • 549

    #2
    man könnte hier auch in Profibereich und Amateurbereich trennen, für mich als Anwender nur Hyrogl..

    Kommentar

    • ropf
      Registrierter Benutzer
      • 02.12.2013
      • 841

      #3
      Hi blaueelise,

      bei diesem Thema bin ich auch nur Amateur, während es Andere hier im Forum gibt, die die Mathematik locker aus dem Handgelenk schütteln ... also mach dir nix draus

      Die Frage: Was ist "ES", das Einem bei gewissen Frauenstimmen die Nackenhärchen vibrieren lässt, den Zweiten beim "seidigen Klang" einer Hochtonkalotte erbeben, die Dritte beim "Schmelz einer Stradivari" dahinschmelzen, den Vierten beim "warmen Sound" seines Röhrenverstärkers zergehen, den Vorvorletzten auf phasenlineare Weichen schwören, und den Vorletzten auf Hornlautsprecher ... ??

      Die Antwort ist alt - Klang ist Struktur. Aber welche Strukturen sind das? Wir finden sie weder im Frequenzgang, noch in einer Impulsantwort, oder in Verzerrungswerten. Und doch sind sie so robust, dass wir eine bestimmte Stimme immer wiedererkennen, egal ob die betreffende Person vor einem steht, von draußen über den Verkehrslärm durchs Fenster, oder sogar über eine miese Telefonleitung.

      Die Cepstrum-Analyse ist nun EIN Tool, um solche Strukturen aufzuspüren und zu untersuchen. Zentrales Element dabei ist die Selbstähnlichkeit wie sie auch Reflektionen und Echos eigen ist - sie werden sichtbar. Das ermöglicht uns nicht nur zB. Lautsprecher- und Raumimpulsantwort weitgehend zu trennen, sondern auch insgesamt tiefere Einblicke in den "Klang" von Lautsprechern.

      Ich werd hier mit zunehmendem Erkenntnisstand, der etwas an der Bändigung passenden Werkzeugs hängt (GNU Oktave) immer wieder mal was dazu schreiben - und irgendwann schaun wir mal, wie reflektionsarm der Visaton RAR wirklich ist

      /ropf
      Zuletzt geändert von ropf; 21.01.2015, 08:31.

      Kommentar

      • jhohm
        Registrierter Benutzer
        • 24.09.2003
        • 4535

        #4
        Hallo /ropf,

        was Du suchst, erscheint mir wie die Antwort auf die Frage, warum die Stimme der Callas so einzigartig war....
        Egal, ob es jemals eine erfüllende Antwort geben wird oder nicht, das GEFÜHL beim Hören ist (für jeden Einzelnen) einzigartig und nicht!!! erklärbar.....

        Klar ist es interssant, die Strukturen zu erkennen, und Callas-ähnliche Stimmen irgendwann erzeugen zu können, aber das ist wie gesagt nur die technische Seite......

        Musik hören, lesen, das leben an sich, ist aber mehr.

        Gruß Jörn.

        p.s. interessant ist es aber schon
        ...Gruß Jörn

        Kommentar

        • markus7
          Gesperrt
          • 21.12.2010
          • 1828

          #5
          ^
          Zitat von ropf Beitrag anzeigen
          Und bitte Religionsfragen und philantropischen Betrachtungen draussen lassen
          War fast vorauszusehen dass das nicht klappen wuerde

          Kommentar

          • kmm
            kmm
            Registrierter Benutzer
            • 11.05.2011
            • 915

            #6
            War fast vorauszusehen dass das nicht klappen wuerde

            im Zeitalter ganzheitlicher Betrachtung lassen sich isolierte
            Sichtweisen nur schwer durchsetzen. Ist ein Manko der Zeit.
            (vor allen Dingen eine Herabwürdigung jhohm's Bemühungen[bezieht sich aufs Zitat])

            in diesem Sinne
            mfgm
            Zuletzt geändert von kmm; 21.01.2015, 16:19.
            so dicht wie beim Urknall kommen wir nicht mehr zusammen

            Kommentar

            • kmm
              kmm
              Registrierter Benutzer
              • 11.05.2011
              • 915

              #7
              Zitat von ropf
              Die Antwort ist alt - Klang ist Struktur. Aber welche Strukturen sind das? Wir finden sie weder im Frequenzgang, noch in einer Impulsantwort, oder in Verzerrungswerten.
              mehr Antwort gibt es da nicht. So wie die Nackenhaare eine gewisse Zeit
              brauchen um sich zu kräuseln, braucht auch die dazugehörige Frauenstimme
              ihre Zeit um ihre "unverwechselbare" Struktur zu offenbaren. Das Zeitfenster
              vom Frequenzganz ist viel zu schmal um hier Rückschlüsse zu ziehen.

              Als Mensch fehlt uns das Organ um direkt Klang und Aufzeichnung einem Spektrum
              zuordnen zu können. Es gibt vermutlich auch nicht eine exakte
              Struktur, die Stimmen oder sonstige Klänge definieren, es sind wohl eher
              Muster innerhalb dessen eine gewisse Bandbreite erlaubt ist, mit fließenden
              Übergängen in beide Richtungen. Das heißt an den "Rändern" sind wir bei der Identifizierung
              nicht mehr völlig sicher.

              Aber eines kann ich dir aus Erfahrung mit Sicherheit garantieren:
              mit zunehmendem Alter wird die Kräuselung der Haare erträglicher, wie die
              der Inflation die uns in diese missliche Lage gebracht hat.

              mfgm
              so dicht wie beim Urknall kommen wir nicht mehr zusammen

              Kommentar

              • kmm
                kmm
                Registrierter Benutzer
                • 11.05.2011
                • 915

                #8
                Ein großes Hindernis Erlebtes und Technisches vergleichen zu können, ist
                der unterschiedliche Zeitfaktor. Erlebtes besteht nie aus einem exakten
                Punkt im Zeitverlauf. Es ist eine Zeitspanne in der sich mehrere Erinnerungen
                summiert darstellen, die man dann Gegenwart nennt. Das technische Equivalent
                müßte auch aus entsprechend "übereinander gelegten" Aufzeichnungen bestehen.
                Hier erhalten wir schon die größten "Übersetzungsfehler" mangels Synchronisation.

                mfgm
                Zuletzt geändert von kmm; 21.01.2015, 19:12.
                so dicht wie beim Urknall kommen wir nicht mehr zusammen

                Kommentar

                • Fosti
                  Registrierter Benutzer
                  • 18.01.2005
                  • 3175

                  #9
                  Interessante Theorie. Kannst Du sie belegen, außer mit Deiner ureigenen Erfahrung?
                  Ich stimme ansonsten dafür, deinen Nick in "Cato" zu ändern; derjenige, der im Senat immer mit "...im übrigen bin ich der Meinung, dass MEG gehört werden muss!" geschlossen hat . (copyright by mechanic)

                  Kommentar

                  • kmm
                    kmm
                    Registrierter Benutzer
                    • 11.05.2011
                    • 915

                    #10
                    Kannst Du sie belegen, außer mit Deiner ureigenen Erfahrung?
                    wenn du mit "ureigene Erfahrung" selbst ausgedacht und hemmungslos
                    zusammengebastelt meinst, kann ich Entwarnung geben, nein, hab ich nicht.

                    Belegen inform von Literaturnachweis, kann ich nicht. Die Angaben stammen
                    aus verschiedenen "populärwissenschaftlichen" Fernsehsendungen mit unterschied-
                    lichen Schwerpunkten. Es muß deshalb nicht falsch sein. Logisch nachvollziehbar
                    ist es allemal. Z.B. unterschiedliche Reaktionszeiten sind unterschiedliche
                    Zeitpunkte, in denen "individuelle Gegenwart" stattfindet.. usw.

                    mfgm
                    so dicht wie beim Urknall kommen wir nicht mehr zusammen

                    Kommentar

                    • Rudolf
                      Registrierter Benutzer
                      • 18.06.2004
                      • 688

                      #11
                      Zitat von ropf Beitrag anzeigen
                      Die Antwort ist alt - Klang ist Struktur. Aber welche Strukturen sind das? Wir finden sie weder im Frequenzgang, noch in einer Impulsantwort, oder in Verzerrungswerten. Und doch sind sie so robust, dass wir eine bestimmte Stimme immer wiedererkennen, egal ob die betreffende Person vor einem steht, von draußen über den Verkehrslärm durchs Fenster, oder sogar über eine miese Telefonleitung.
                      Bis zum wirklichen Verständnis wird es wohl noch eine Zeit dauern. Aber hier zwei Blicke auf den aktuellen Stand, sehr "organisch" und aus zwei verschiedenen Richtungen gesehen:

                      Pitch Processing Sites in the Human Auditory Brain

                      BINAURAL MODELS AND THEIR TECHNOLOGICAL APPLICATION von Jens Blauert (Soundtrack,Paper und Folien können von der Website heruntergeladen werden)

                      Vielleicht auch Griesinger lesen.
                      Rudolf
                      www.dipolplus.de/Dipol_Schallwand.pdf

                      Kommentar

                      • ropf
                        Registrierter Benutzer
                        • 02.12.2013
                        • 841

                        #12
                        Um mal den "Trick" an der ganzen Sache zu beleuchten, nehmen wir mal einen "idealen Lautsprecher" an - der hätte eine schnurgeraden Frequenzgang von Null bis Unendlich, keinerlei Phasendrehungen - seine Impulsantwort wäre ein perfekter Dirac-Impuls.

                        Nun fügen wir ein ideales Echo hinzu - also eine verkleinerte und zeitlich verschobene Kopie des Eingansimpulses. Spielen wir veschiedene Töne durch dieses System, überlagern sich Impuls und Echo konstruktiv oder destruktiv, je nach Periodenlänge des Tons --> der vorher schnurgerade Frequenzgang wird wellig.

                        Diese Welligkeit, ist über den gesamten Frequenzbereich von Null bis Unendlich konstant. Je größer der zeitliche Abstand des Echos, desto enger liegen die Maxima des Rippels beieinander und umgekehrt.

                        Halten wir fest: ein Echo hinterlässt im Frequenzgang eine eindeutige Signatur in Form eines periodischen Rippels.

                        Fügen wir nun ein zweites Echo hinzu, hinterlässt das ebenfalls seinen Rippel im Frequenzgang, der sich mit dem ersten überlagert. Dasselbe geschieht mit jedem weiteren Echo ...

                        Wer nun auf die Idee kommt, die Impulsantwort eines realen Systems als Folge von lauter Echos zu betrachten - und seinen Frequenzgang als Summe aller Rippel-Signaturen --> Bingo! Du hast die Grundzüge der Fouriertransformation und den Zusammenhang von Imusantwort und Frequenzgang verstanden

                        Soweit nix Neues. Die Cepstrumanalyse ist nun darauf gezüchtet, Echos bzw. Reflexionen im Zeitbereich durch ihre zugehöigen Rippelsignaturen - also Periodizitäten im Frequenzgang - aufzuspüren und vom eigentlichen Signal zu trennen.

                        Nach der Darstellung im 1.Link reagiert das menschliche Gehör besonders empfindlich auf Periodizitäten im Frequenzgang - winzige Peaks, die man einzelstehend getrost ignorieren kann - werden deutlich hörbar, wenn sie periodisch auftreten.

                        Der Autor fordert zu einem Selbstversuch auf mit Kopfhörer und per DSP künstlich eingefügten Peaks und Dips im Frequenzgang. Wie wir aber gerade gelernt haben, können wir uns solche periodischen Peaks und Dips ganz ohne DSP ganz einfach erzeugen, in dem wir in einem Audioeditor einem Track eine absenkte (um sagen wir mal 20db) und leicht verzögerte Kopie zumischen ...

                        Mit der Cepstrum-Analyse können wir nun solche - gehörten, aber im Messschrieb kaum zu sehenden - Effekte sichtbar machen.

                        Kommentar

                        • ropf
                          Registrierter Benutzer
                          • 02.12.2013
                          • 841

                          #13
                          @Rudolph: Danke für die Links.

                          In meinem 2.Link ist auf Seite 10 eine exponentiell abklingende Sinusschwingung abgebildet plus einem verzögerten und verkleinerten Echo. Das Cepstrum zeigt jedoch keinen einzelnen Peak, sondern eine alternierende abnehmende Folge ...

                          Das verstehe ich gerade nicht - liegt das im Vefahren selbst oder im besonderen Zusammenspiel von Signal und Echo?

                          Wenn es im Verfahren liegt - und ein einzelnes Echo im Cepstrum prinzipell eine abnehmende Folge von alternierenden Peaks erzeugt - was passiert dann mit einer abnehmenden Folge von Echos, wie sie zB. infolge einer Raumresonanz auftreten?

                          Wäre es verkehrt anzunehmen, das eine Folge von Echos in gleichem zeitlichen Abstand im Cepstrum zu einem "Superpeak" verschmizt - so aus allgemeinen Symmetrieerwägungen?

                          Kommentar

                          • Rudolf
                            Registrierter Benutzer
                            • 18.06.2004
                            • 688

                            #14
                            Zitat von ropf Beitrag anzeigen
                            Wäre es verkehrt anzunehmen, das eine Folge von Echos in gleichem zeitlichen Abstand im Cepstrum zu einem "Superpeak" verschmizt - so aus allgemeinen Symmetrieerwägungen?
                            Abbildung 8 in der Tauch-Arbeit zeigt schön, wie sich die Folgen der Reflexionen im Cepstrum-Diagramm verteilen: immer mit dem n-fachen von k
                            Klicke auf die Grafik für eine vergrößerte Ansicht

Name: cepstrum reflect.gif
Ansichten: 1
Größe: 14,4 KB
ID: 626227
                            Die grünen und roten Linien sind jeweils äquidistant zum Ursprung und untereinander. 3 x k ist im Diagramm praktisch nicht mehr erkennbar.
                            Rudolf
                            www.dipolplus.de/Dipol_Schallwand.pdf

                            Kommentar

                            • ropf
                              Registrierter Benutzer
                              • 02.12.2013
                              • 841

                              #15
                              Hi Rudolf,

                              soweit ist mir das schon klar, aber nicht unbedingt die Interpretation von Ursache und Wirkung ... lass mich die Idee vom "Superpeak" etwas ausführen.

                              Eine Reflektion im Zeitbereich erzeugt einen sinusförmigen Rippel im Frequenzbereich. Durch die Logarihmierung wird der Rippel verzerrt - "Oberrippel" treten auf - und äussern sich im Cepstrum eben durch Rahmonische. Das Auftreten von MEHREREN Rahmonischen wäre demnach bei EINER Reflektion normal.

                              Der Grad der Verzerrung - und damit die Höhe der Rahmonischen - hängt vom Amplitudenverhältnis Refletion/Originalimpuls ab.

                              Nun nehmen wir eine exponentiell abnehmende Folge von Reflexionen - das Verhältnis der Amplituden und die Zeitabstände seien dabei konstant. Dann ist der "Grundrippel" der zweiten Reflektion genausolang wie der "1.Oberrippel" der 1.Reflektion ... und so weiter.

                              Auch amplitudenmäßig sieht das nach einer strengen Proportionalität aus. Es ist also durchaus denkbar, dass sich im Fall der oben angenommenen Folge - die Rahmonischen der "Grund-Quefrency" komplett canceln und nur ein Grundpek im Cepstrum zurückbeleibt.

                              Ob das jetz so zutrifft hängt davon ab, wie die Phase des "1.Oberrippel" der ersten Reflektion" zur Phase des "Grundrippels" der 2.Reflektion im logarithmierten Frequenzgang zusammenhängen - das bekomm ich grad nicht gebacken.

                              Hab ein bisschen beim Griesinger gestöbert. Was er über Klarheit der Wiedergabe schreibt - über das komplette Versagen etablierter und standartisierter Kriterien für deren Bewertung - und wie man auch bei langen Nachhallzeiten eine gute Wiedergabe erreicht - macht ihn mir sehr symphatisch.

                              Gruß
                              /ropf
                              Zuletzt geändert von ropf; 23.01.2015, 07:05.

                              Kommentar

                              Lädt...
                              X