Das Systemdesign und die Ergebnisse der anschließenden experimentellen Untersuchung sind in fünf Unterabschnitte gegliedert. Zunächst wird der Systemaufbau des virtuellen ANC-Kopfhörers beschrieben. Anschließend wird die Position der Membran für die beste Regelungsleistung untersucht. Drittens wird die ANC-Leistung bei Vorhandensein von breitbandigem grauem Rauschen mit dem auf einem Kopf- und Rumpfsimulator (HATS) implementierten System bestimmt. Schließlich wird die Leistung des Systems bei verschiedenen Arten von synthetisierten Umgebungsgeräuschen bewertet. Schließlich wird ein einfaches System zur Verfolgung des Messortes eingesetzt, um die unvermeidlichen Kopfbewegungen des Benutzers zu tolerieren.
Virtuelles ANC-Kopfhörersystem
Eine schematische Darstellung der vorgeschlagenen Systemkomponenten und ihrer Anordnung ist in Abb. 1a zu sehen. Zwei Sekundärlautsprecher werden hinter dem Kopf des Benutzers platziert (wie sie in einer Kopfstütze integriert wären), einer an jeder Seite, um den Primärschall aus der Umgebung an jedem Ohr zu kontrollieren und den Benutzer dadurch in eine ruhigere Umgebung zu versetzen. Ein LDV wird verwendet, um das akustische Signal am Eingang des Gehörgangs zu bestimmen, indem die Oberflächenschwingung eines kleinen, leichten und retro-reflektierenden Membranaufnehmers in der Nähe gemessen wird. Während Abb. 1a zwei eintreffende Laserstrahlen zeigt, einen für jedes Ohr, wird hier der Kürze und Klarheit halber eine Ein-Ohr-Lösung betrachtet und beschrieben, ohne jedoch die Allgemeingültigkeit des Zwei-Ohr-Äquivalents zu beeinträchtigen.
Für ANC-Systeme wird eine Ruhezone als ein Bereich definiert, in dem eine Schalldämpfung von mehr als 10 dB erreicht wird, wobei die Größe der Zone etwa ein Zehntel der Wellenlänge des Schalls in einem diffusen Schallfeld beträgt4. Wenn die Membran in der Nähe des Gehörgangs platziert wird, kann eine solche Ruhezone um sie herum geschaffen werden, wodurch die Schallausbreitung zum Trommelfell reduziert wird. Die beiden hier vorgestellten Sekundärlautsprecher wurden im Abstand von 0,44 m mit einem Azimutwinkel von 45 Grad zum Benutzer hin aufgestellt (siehe Abb. 1b). Der Controller verwendet die Oberflächenschwingungsgeschwindigkeit der Membran von einem LDV als Fehlersignal für die adaptive Steuerung, deren Einzelheiten im Unterabschnitt Methoden – Geräuschkontrollalgorithmus zu finden sind.
Normale Kopfbewegungen können durch ein relativ einfaches kamerabasiertes Trackingsystem ausgeglichen werden, das in Abb. 1a dargestellt ist und aktiv ein Paar orthogonaler, galvanometergesteuerter Spiegel steuert, um den Einfall des Sondenlaserstrahls auf die Mitte der Membran aufrechtzuerhalten. Durch die Anwendung eines maßgeschneiderten Bildverarbeitungsalgorithmus kann das LDV auf diese Weise das akustische Fehlersignal in Echtzeit aus der Ferne ermitteln.
Der Versuchsaufbau ist in Abb. 2a dargestellt. Das Experiment wurde in einem ruhigen Raum mit einem Hintergrundschalldruckpegel von 38,5 dBA (A-bewerteter SPL, dB re. 20 μPa) durchgeführt. Ein Kopf-Rumpf-Simulator (HATS; Brüel und Kjær Typ 4128-C) mit Simulatoren für das rechte und das linke Ohr wurde verwendet, um den Schall zu messen, der an den Trommelfellen der Ohren eines Benutzers auftreten würde. Abbildung 2b zeigt den Aufbau und die Konfiguration des in diesem System verwendeten Membran-Tonabnehmers. Der Tonabnehmer besteht aus einem Stück retroreflektierender Folie (3 M-Scotchlite Sheeting 761027) mit einer Dicke von 0,1 mm, die über ein kurzes, geschlossenes zylindrisches Polymerrohr mit einem Durchmesser von 9,2 mm, einer Tiefe von 4,6 mm und einer Masse von ca. 0,2 g gespannt und darauf geklebt ist. Die Folie wurde als Membran verwendet, um das rückgestreute optische Signal im Verhältnis zum einfallenden Laserstrahl zu maximieren, unabhängig von einem nicht normalen Strahleinfall, was bei den unvermeidlichen Kopfbewegungen von Vorteil ist. Die Membran funktioniert ähnlich wie eine Mikrofonmembran und wandelt die durch den akustischen Druck verursachte mechanische Schwingung letztlich in ein elektrisches Signal um. Allerdings befinden sich in diesem Fall weder elektronische Bauteile im Inneren (z. B. ein Vorverstärker zur Verarbeitung des Messsignals), noch ist eine Verkabelung zur Signalübertragung erforderlich. Stattdessen erfolgt die Signalaufbereitung und -umwandlung dezentral in der Optoelektronik des LDV. Detaillierte Parameter für das retroreflektierende Material und den Frequenzgang des Membranabnehmers wurden ermittelt und sind in der ergänzenden Abb. S1 und der ergänzenden Tabelle S1 zu finden.
Das Datenerfassungssystem befindet sich in der vorgeschlagenen Anordnung zusammen mit dem LDV an einem entfernten Ort. Das LDV (Polytec PDV-100) hat einen messbaren Frequenzbereich von 20 Hz bis 22 kHz. Das LDV wurde auf einem Stativ montiert, das vom HATS und den Lautsprechern (Genelec 8010A) schwingungsisoliert ist. Die Abtastrate des ANC-Controllers (Antysound TigerANC WIFI-Q) wurde auf 32 kHz eingestellt, und die Filterlängen für den primären und sekundären Pfad wurden auf 1024 Abgriffe festgelegt. Es sei darauf hingewiesen, dass der adaptive Regelalgorithmus einfach das gemessene Membrangeschwindigkeitssignal direkt nahm und versuchte, es zu minimieren. Obwohl das Geschwindigkeitssignal auf irgendeine Weise in Schalldruck umgewandelt werden könnte, war dies nicht notwendig – das Ergebnis wäre dasselbe, egal ob es sich um das Rohsignal oder eine Ableitung davon handelt.
Optimale Platzierung des Membranabnehmers
Obgleich es naheliegend ist, den Membranabnehmer so nah wie möglich am Gehörgang zu platzieren, ist nicht sofort klar, welche spezifische(n) Stelle(n) praktikabler/optimaler wäre(n) und wie die ANC-Leistung für jede einzelne Stelle aussehen könnte. In Abb. 3 sind vier mögliche Aufnahmestellen dargestellt, wobei sich Aufnahmestelle Nr. 1 auf der vorderen Kerbe der Ohrmuschel, Aufnahmestelle Nr. 2 auf dem Tragus, Aufnahmestelle Nr. 3 im Cavum concha und Aufnahmestelle Nr. 4 auf dem Ohrläppchen befindet. Die Experimente wurden im linken Kunstohr der HATS durchgeführt. Nur ein Lautsprecher, der sich in 0,6 m Entfernung direkt hinter dem HATS befindet, wird hier als Primärquelle verwendet. Das Signal der Primärquelle war ein breitbandiges graues Rauschen mit einem angepassten Fletcher-Munson-Kurvenfilter28 von 500 Hz bis 6 kHz (siehe ergänzende Abb. S2). Der Filter wurde hier angewendet, um einen gemessenen Schalldruckpegel mit einem flachen Frequenzgang innerhalb des HATS zu erhalten. Der Gesamt-SPL am linken Trommelfell betrug 77,7 dB (re. 20 μPa – im Folgenden der Kürze halber zusammengefasst) bei ausgeschalteter ANC.
Mit eingeschalteter ANC waren die Leistungen an den Standorten Nr. 1 und Nr. 2 ähnlich, wobei der resultierende Gesamtschalldruck 69,2 dB bzw. 70,9 dB betrug. Die Schallreduzierung war jedoch nur bei Frequenzen unter 4 kHz signifikant. Der Grund dafür könnte sein, dass die an diesen beiden Punkten gemessenen Schalldrücke nur unterhalb von 4 kHz denen im Gehörgang ähneln. Daher ist auch die Kontrollleistung an diesen beiden Punkten bis 4 kHz begrenzt. Die Schallreduzierung am Standort Nr. 3 war mit einem Gesamtschalldruckpegel von 63,5 dB am besten, wenn ANC eingeschaltet war. Der Gesamtschalldruckpegel wurde über den gesamten Frequenzbereich von 500 Hz bis 6 kHz um 14,2 dB reduziert. Der Standort Nr. 4, das Ohrläppchen, war weiter vom Gehörgang entfernt als alle anderen ausgewählten Standorte. Der wirksame Frequenzbereich der Schallreduzierung reichte nur bis etwa 3 kHz, wobei im Bereich von 5 bis 6 kHz eine Zunahme von etwa 6 dB zu beobachten war. Auf der Grundlage der Ergebnisse dieser Leistungsanalyse der Membranposition wurde die Position Nr. 3 (das Cavum concha) als die optimale Position für die Membran identifiziert; in den übrigen hier beschriebenen experimentellen Untersuchungen wird daher diese Membranposition verwendet.
Leistungsbewertung für Breitbandgeräusche
Abbildung 4 zeigt die gemessenen Geräuschspektren für jedes Ohr ohne und mit ANC für drei verschiedene primäre Schallfeldszenarien. Die mit gemeinsamen Signalen angesteuerten Lautsprecher wurden so angeordnet, dass eine zunehmend komplexe Umgebung mit einem oder mehreren Reflektoren entstand. Als Signal wurde wieder das breitbandige graue Rauschen verwendet, das demjenigen entspricht, das für die in Abb. 3 dargestellten Ergebnisse verwendet wurde. Alle Testergebnisse wurden durch Mittelwertbildung über eine Datenlänge von 15 Sekunden erzielt. Abbildung 4a zeigt den Aufbau, bei dem eine einzelne Primärquelle in 0,6 m Entfernung direkt hinter dem HATS platziert wurde, um den von einer nahegelegenen Quelle kommenden Schall zu simulieren, ohne Berücksichtigung von Reflexionen aus der Umgebung. Nach Aktivierung der ANC wurde eine Dämpfung von fast 15 dB erzielt, wobei der Gesamtschalldruckpegel am linken und rechten Ohr von 78,1 dB auf 63,8 dB bzw. von 77,3 dB auf 62,0 dB reduziert wurde. Dieses Szenario ähnelt dem des aktuellen Systems nach dem Stand der Technik20, bei dem der Schall bis zu 1 kHz kontrolliert wurde, obwohl hier die Verbesserung über einen viel breiteren Frequenzbereich, nämlich bis zu 6 kHz, erzielt wurde. Es ist erwähnenswert, dass die Tests auch in diesem Fall nicht gleichzeitig, sondern auf jeder Seite separat durchgeführt wurden.
Abbildung 4b zeigt den Aufbau und die Ergebnisse einer Situation, in der zwei Primärlautsprecher willkürlich an zwei verschiedenen Orten platziert wurden. Dies kann eine Situation darstellen, in der sich der Benutzer in der Nähe einer großen, starren, reflektierenden Fläche befindet, wie z. B. einem Tisch oder einer Wand. In diesem Fall sind die akustischen Signale von der ursprünglichen Quelle und dem Reflektor kohärent. Es wurde eine Dämpfung von etwa 13 dB erreicht, wobei der Gesamtschalldruckpegel von 80,2 dB und 77,9 dB auf 66,0 dB und 65,2 dB am linken bzw. rechten Ohr reduziert wurde. Abbildung 4c zeigt eine allgemeinere Situation, in der mehrere Reflektoren vorhanden sind. Hierfür wurden vier Primärlautsprecher willkürlich an verschiedenen Stellen um den Kopf herum positioniert. Es wurde eine Dämpfung von ca. 11 dB erreicht, wobei der Gesamtschalldruckpegel am linken und rechten Ohr von 80,4 dB auf 68,9 dB bzw. von 80,1 dB auf 69,4 dB gesenkt wurde. In allen drei Beispielszenarien erzielte das demonstrierte System eine Reduzierung von mindestens 10 dB über den gesamten Frequenzbereich von 500 Hz bis 6 kHz. Es ist erwähnenswert, dass die Platzierung dieser primären Quellen willkürlich gewählt wurde, die beobachteten Regelungsleistungen dürften jedoch für jede andere ähnliche Konfiguration ähnlich sein.
Leistungsbewertung für synthetischen Umgebungslärm
Um die Leistungsfähigkeit der vorgeschlagenen Lösung weiter zu demonstrieren, wurde die Leistung in Gegenwart von drei verschiedenen Arten von vorab aufgezeichneten Umgebungslärmszenarien bewertet. Ähnlich wie bei der kürzlich implementierten Konfiguration20 befand sich die primäre Quelle etwa 1,2 m direkt hinter dem HATS, wobei nur ein Kanal (rechtes Ohr) gesteuert wurde. Die drei Experimente wurden in einer halbschalltoten Kammer durchgeführt. Zunächst wurde eine Aufnahme von Flugzeuginnengeräuschen29 als primäre Signalquelle verwendet. Die vom HATS vor und nach der ANC aufgezeichneten 15-Sekunden-Signale sind in Abb. 5a dargestellt, wobei die entsprechenden Spektren über diese Dauer gemittelt wurden. Der Gesamtschalldruckpegel wurde deutlich von 74,7 dB auf 59,6 dB gesenkt – eine Verbesserung um mehr als 15 dB. Zweitens wurde ein Beispiel für einen Flugzeugvorbeiflug30 untersucht. Abbildung 5b zeigt das vom HATS beobachtete Zeitsignal eines solchen instationären Geräuschs vor und nach der ANC sowie das Spektrum (gemittelt über nur 3 bis 8 Sekunden). Auch hier ist eine deutliche Verringerung im Bereich von 500 Hz bis 6 kHz festzustellen. Dort, wo das Rauschen am stärksten ausgeprägt war, d. h. von 3 bis 8 s, wurde der Gesamtschalldruckpegel von etwa 82,1 dB auf 61,6 dB reduziert – eine Schalldämpfung von mehr als 20 dB. Schließlich wurde eine Aufnahme einer sprechenden Menschenmenge als primäres Quellsignal verwendet31. Abbildung 5c zeigt die 15-Sekunden-Signale im Zeitbereich und im Frequenzbereich vor und nach der ANC. Der Gesamtschalldruckpegel wurde von 75,5 auf 59,8 dB geregelt; es wurde eine Verringerung um über 15 dB erreicht. Tabelle 1 fasst die gemittelten Gesamtschalldruckpegel ohne und mit Kontrolle durch das vorgeschlagene System für diese neuen Szenarien zusammen, wobei mit dem vorgeschlagenen System eine Rauschminderung von 15-20 dB bis zu 6 kHz erreicht werden kann. Die Audioaufnahmen vor und nach der ANC können Sie im ergänzenden Film 1 sehen. Es ist wichtig anzumerken, dass die derzeitige, dem Stand der Technik entsprechende virtuelle ANC-Lösung mit einer angegebenen oberen Frequenzleistung von etwa 1 kHz keine so beeindruckende Leistung erbringen würde wie der hier vorgestellte virtuelle ANC-Kopfhörer, da, wie in Abb. 5 zu sehen ist, liegt der bedeutendere Frequenzgehalt in allen drei Beispielsignalen hauptsächlich im Bereich von 2 bis 4 kHz.
Leistungsbewertung bei Kopfbewegungen
Eine Person neigt zu ständigen Kopfbewegungen, daher sollte der Sondenlaserstrahl des LDV in der Lage sein, die entsprechende willkürliche Bewegung der Membran in den Ohren zu verfolgen. Derartige Tracking-LDV-Lösungen wurden bereits für zahlreiche komplexe Messaufgaben erforscht, entwickelt und eingesetzt26; das vorliegende Szenario stellt eine weitere interessante Anwendung dar. Zur Demonstration des Konzepts wurde daher ein einfaches Tracking-System implementiert. Dieses maßgeschneiderte kamerabasierte Verfolgungssystem ist in Abb. 6 dargestellt, wobei die Spezifikationen im Unterabschnitt Methoden – Kopfverfolgungssystem dargestellt sind. Das hier verwendete Szenario ist dasselbe wie das in Abb. 4a beschriebene, d. h. mit einer einzigen Schallquelle unmittelbar hinter dem Kopf.
Die Bewegung einer Markierung auf dem Ohrläppchen des HATS, wie in Abb. 6c dargestellt, wurde vom bildverarbeitungsbasierten Verfolgungssystem bestimmt, um einen nahezu optimalen Laserstrahleinfall auf die Membran aufrechtzuerhalten und ein nützliches Fehlersignal zu erhalten. In der ergänzenden Abbildung S3 und den zugehörigen Anmerkungen werden die Auswirkungen von außermittigen Messungen und unterschiedlichen Einfallswinkeln des Laserstrahls auf die Systemleistung dargestellt. Insgesamt war die Leistung nicht besonders empfindlich gegenüber der genauen Position des Laserstrahls auf der Membran, so dass es nicht als notwendig erachtet wurde, dass der Laserstrahleinfall genau in der geometrischen Mitte liegt. Wenn der Laserstrahl leicht außermittig auftrifft, bleibt die ANC-Leistung erhalten. Auch der Einfallswinkel des Laserstrahls hatte keinen signifikanten Einfluss auf die Leistung. Bei einem Einfallswinkel von beachtlichen 60 Grad sinkt das LDV-Signal um etwa 5 dB, was sich wiederum nur minimal auf die ANC-Leistung auswirkt. Diese Eigenschaften haben den Grundstein für die erfolgreiche Anwendung des Tracking-Systems gelegt, um die unvermeidlichen Kopfbewegungen des Benutzers zu bewältigen.
Abbildung 7 zeigt vier Regelungsleistungen – bei ausgeschaltetem ANC (1) und eingeschaltetem ANC (2) für einen stationären HATS und bei eingeschaltetem ANC mit deaktiviertem Kopf-Tracking-System (3) und aktiviertem ANC (4) für einen bewegten HATS. Die Bewegung des HATS wurde manuell mit einer Vorwärts-Rückwärts-Bewegung implementiert, um eine Person zu simulieren, die sich im Sitzen hin und her bewegt. Die maximale Entfernung, die der HATS im ergänzenden Film 2 zurücklegte, betrug etwa 0,08 m von Spitze zu Spitze mit einer maximalen Geschwindigkeit von etwa 0,04 m/s. Abbildung 7a zeigt die 15-s-Probe der Zeitbereichsmessung für jeden Fall mit der gleichen Konfiguration wie in Abb. 4a. Abbildung 7b zeigt das entsprechende gemittelte Frequenzspektrum für jeden Fall über die gesamte Dauer. Ähnlich wie bei den zuvor in Abb. 4a dargestellten Ergebnissen wurde der Gesamtschalldruckpegel über den Frequenzbereich von 500 Hz bis 6 kHz für die stationäre Situation von 81,1 auf 64,1 dB reduziert.
Wenn sich der HATS mit eingeschaltetem ANC, aber deaktiviertem Tracking bewegte, entfernte sich der Kopf (und damit die Membran) vom Laserstrahl der Sonde; das LDV-Signal „fiel dadurch aus“ oder führte zu einer Schwingungsmessung, die nicht repräsentativ für den Schalldruck am Ohr war. Dies kann leicht dazu führen, dass das Kontrollsystem abweicht, und wie in Abb. 7b zu sehen ist, stieg der Gesamtschalldruckpegel tatsächlich deutlich von 81,1 auf 99,5 dB. Wenn das Tracking-System aktiviert war, behielten die Spiegel den Einfall des Laserstrahls auf der Membran bei, während sich das HATS bewegte. Somit blieb die LDV-Messung für die adaptive Steuerung gültig. Wie in Abb. 7b dargestellt, reduzierte das System den Schall über den gesamten Frequenzbereich von 81,1 auf 70,4 dB. Die Regelungsleistung blieb während der Bewegung des HATS bei mindestens 10 dB, was die Notwendigkeit der Verwendung eines Nachführsystems für das ANC-System belegt. Auch diese Audioaufnahmen sind im ergänzenden Film 2 zu sehen.
Schreibe einen Kommentar