Systemets design og resultaterne af den efterfølgende eksperimentelle undersøgelse er opdelt i fem underafsnit. Indledningsvis beskrives systemdesignet af den virtuelle ANC-hovedtelefon. Efterfølgende undersøges det, hvor membranen skal placeres for at opnå den bedste kontrolydelse. For det tredje bestemmes ANC-ydelsen i tilstedeværelse af bredbåndsgrå støj med systemet implementeret på en hoved- og torsosimulator (HATS). Endelig vurderes systemets ydeevne for forskellige former for syntetiserede støjsignaler fra omgivelserne i den virkelige verden. Til sidst indarbejdes brugen af et simpelt system til sporing af målepositionen for at gøre det muligt at tolerere uundgåelige hovedbevægelser hos brugeren.

Design af et virtuelt ANC-hovedtelefonsystem

En skematisk oversigt over de foreslåede systemkomponenter og deres placering er vist i fig. 1a. To sekundære højttalere er placeret bag brugerens hoved (som de ville være det, hvis de var integreret i en nakkestøtte), en på hver side for at kontrollere den primære lyd fra det omgivende miljø ved hvert øre og dermed placere brugeren i et mere roligt miljø. En LDV anvendes til at bestemme det akustiske signal ved indgangen til øregangen ved at måle overfladevibrationerne fra en lille, let og reflekterende membranaftager, der er placeret i nærheden. Selv om figur 1a viser to indgående laserstråler, én til hvert øre, betragtes og beskrives heri en løsning med ét øre af hensyn til kortfattethed og klarhed, men uden tab af generalitet for den tilsvarende løsning med to ører.

Figur 1
figure1

En virtuel ANC-hovedtelefon. (a) Der dannes en stille zone i hvert øre ved hjælp af et nærliggende sekundært højttalerpar til at reducere lyden i øret, idet det nødvendige fejlsignal bestemmes ud fra en LDV-måling af vibrationen af en lille membranpickup, der er placeret tæt på øregangen. Brugerens bevægelser tages i betragtning ved hjælp af et kamerabaseret sporingssystem, som aktivt styrer de galvanometerdrevne spejle for at styre laserstrålen og fastholde dens position på membranen. (b) Placering af de sekundære højttalere. Hver sekundær højttaler genererer anti-støjsignaler gennem ANC-controlleren (ikke vist).

For ANC-systemer defineres en stille zone som et område, hvor der opnås en lyddæmpning på mere end 10 dB, idet zonestørrelsen er ca. en tiendedel af lydens bølgelængde i et diffust lydfelt4. Når membranen er placeret tæt på øregangen, kan der skabes en sådan stille zone omkring den, hvorved lyden, der forplanter sig til trommehinden (trommehinden), reduceres. De to sekundære højttalere, der præsenteres her, blev placeret med en afstand på 0,44 m og en azimuthvinkel på 45 grader i retning af brugeren, som vist i fig. 1b. Styringen tager membranens overfladevibrationshastighed fra en LDV som fejlsignal for den adaptive styring, hvis detaljer findes i underafsnittet Metoder – Støjstyringsalgoritme.

Normale hovedbevægelser kan imødekommes ved hjælp af et relativt ukompliceret kamerabaseret sporingssystem, skitseret i fig. 1a, som aktivt styrer et par ortogonale, galvanometerdrevne spejle for at opretholde sonde-laserstrålens indfald på membranens centrum. Ved hjælp af en skræddersyet billedbehandlingsalgoritme kan LDV’en derved få det akustiske fejlsignal på afstand i realtid.

Den eksperimentelle opsætning er vist i fig. 2a. Forsøget blev udført i et stille rum med et baggrundslydtryksniveau på 38,5 dBA (A-vægtet SPL, dB re. 20 μPa). Der blev anvendt en hoved- og torsosimulator (HATS; Brüel og Kjær Type 4128-C) med højre og venstre øresimulator til at måle den lyd, der ville blive oplevet ved trommehinderne i en brugers ører. Figur 2b viser udformningen og konfigurationen af den membranafspiller, der anvendes i dette system. Pickuppen består af et stykke reflekterende folie (3 M-Scotchlite Sheeting 761027) med en tykkelse på 0,1 mm, der er spændt over og klæbet fast til et kort, lukket polymercylindrisk rør med en diameter på 9,2 mm, en dybde på 4,6 mm og en masse på ca. 0,2 g. Den resulterende kombination er derfor så minimalt invasiv som praktisk muligt med hensyn til størrelse og masse. Folien blev anvendt som membran for at maksimere det tilbagespredte optiske signal i forhold til den indgående laserstråle, uanset om strålens indfaldsvinkel ikke er normal, hvilket er en fordel i tilfælde af uundgåelige hovedbevægelser. Membranen fungerer på samme måde som en mikrofonmembran, idet den omdanner den akustiske trykinducerede mekaniske vibration i sidste ende til et elektrisk signal. I dette tilfælde er der imidlertid ingen elektroniske komponenter indeni (f.eks. en forforstærker til behandling af det målte signal), og der er heller ikke behov for ledninger til signaloverførsel. I stedet foregår signalbehandlingen og -konverteringen eksternt i LDV’s opto-elektronik. Detaljerede parametre for det retro-reflekterende materiale og membranpickuppens frekvensrespons er blevet bestemt og kan findes i supplerende figur S1 og supplerende tabel S1.

Figur 2
figur2

Eksperimentel opsætning til en stationær HATS. (a) To sekundære højttalere blev placeret bag HATS’en til lydkontrol. Flere primære højttalere (tre vist) blev placeret vilkårligt for at simulere uønsket lyd fra forskellige retninger. Sonde-laserstrålen fra LDV’en blev rettet mod membranen i øret. (b) En membran blev anbragt tæt på øregangen i HATS’ens venstre syntetiske øre. LDV’en bestemmer membranens overfladehastighed på afstand som fejlsignal for ANC-controlleren.

Dataindsamlingssystemet befinder sig på et fjernt sted sammen med LDV’en i det foreslåede arrangement. LDV’en (Polytec PDV-100) har et målbart frekvensområde fra 20 Hz til 22 kHz. LDV’en var monteret på et stativ, vibrationsisoleret fra HATS og højttalerne (Genelec 8010A). ANC-controllerens samplingfrekvens (Antysound TigerANC WIFI-Q) blev indstillet til 32 kHz, og filterlængderne for både primær og sekundær vej blev indstillet til 1024 taps. Det skal bemærkes, at den adaptive kontrolalgoritme blot tog det målte membranhastighedssignal direkte og forsøgte at minimere det. Selv om hastighedssignalet potentielt kunne omdannes til lydtryk på en eller anden måde, var dette ikke nødvendigt – resultatet ville være det samme, uanset om det var det rå signal eller en afledt form af det.

Optimal placering af membranaftageren

Selv om det er indlysende at placere membranaftageren så tæt på øregangen som muligt, er det ikke umiddelbart klart, hvilke specifikke placeringer der var mere gennemførlige/optimale, og hvad ANC-ydelsen kunne være for hver af dem. Fire mulige opsamlingssteder er illustreret i fig. 3, hvor sted nr. 1 er på pinna’s forreste notch, sted nr. 2 er på tragus, sted nr. 3 er i cavum concha, og sted nr. 4 er på lobulus. Forsøgene blev udført i det venstre syntetiske øre på HATS. Kun én højttaler, der er placeret 0,6 m væk direkte bag HATS, anvendes her som primær kilde. Det primære kildesignal var en bredbåndet grå støj med et tilpasset Fletcher-Munson-kurvefilter28 fra 500 Hz til 6 kHz (se supplerende fig. S2). Filteret blev anvendt her for at give et målt SPL med et fladt frekvensrespons inde i HATS. Den samlede SPL ved venstre trommehinde var 77,7 dB (re. 20 μPa-omgivet herefter for korthedens skyld) med ANC slukket.

Figur 3
figur3

Den SPL’er (dB re. 20 μPa) målt fra HATS’ venstre øresimulator, der simulerer den lyd, som en bruger oplever ved venstre trommehinde med og uden ANC, når membranen befandt sig ved (a) position #1-anterior notch; (b) position #2-tragus; (c) position #3-cavum concha; og (d) position #4-lobule af HATS’ venstre syntetiske øre.

Med ANC slået til var præstationerne ved placering nr. 1 og nr. 2 ens, og den resulterende samlede SPL var henholdsvis 69,2 dB og 70,9 dB. Lydreduktionen var dog kun signifikant ved frekvenser under 4 kHz. Årsagen kan være, at lydtrykket målt på disse to punkter kun svarer til lydtrykket i øregangen under 4 kHz. Derfor er kontrolresultaterne ved de to punkter også begrænset op til 4 kHz. Lydreduktionen på sted nr. 3 var den bedste med et samlet SPL på 63,5 dB, da ANC var aktiveret. Den samlede SPL blev reduceret med 14,2 dB over hele frekvensområdet fra 500 Hz til 6 kHz. Placering nr. 4, lobulus, var længere væk fra øregangen end nogen af de andre udvalgte placeringer. Det effektive frekvensområde for lydreduktionen var kun op til ca. 3 kHz med en stigning på ca. 6 dB i virkeligheden i intervallet 5 til 6 kHz. På grundlag af resultaterne af denne analyse af membranens ydeevne blev placering nr. 3 (cavum concha) identificeret som den optimale placering af membranen; i de resterende eksperimentelle undersøgelser, der er beskrevet heri, er det derfor denne membranposition, der anvendes.

Evaluering af ydeevne for bredbåndsstøj

Figur 4 viser de målte støjspektrer for hvert øre uden og med ANC for tre forskellige primære lydfeltscenarier. Højttalere, der blev drevet med fælles signaler, blev anbragt for at skabe stadig mere komplekse omgivelser med en eller flere reflektorer. Det anvendte signal var igen den bredbåndede grå støj, der svarer til det signal, der blev anvendt til at opnå de resultater, der er vist i fig. 3. Alle testresultater blev opnået ved at beregne et gennemsnit over en datalængde på 15 sekunder. Figur 4a viser opstillingen, hvor en enkelt primær kilde var placeret 0,6 m væk direkte bag HATS’en for at simulere lyden fra en nærliggende kilde uden hensyntagen til eventuelle refleksioner fra omgivelserne. Efter aktivering af ANC blev der opnået en dæmpning på næsten 15 dB, idet den samlede SPL blev reduceret fra 78,1 dB til 63,8 dB og fra 77,3 dB til 62,0 dB ved henholdsvis venstre og højre øre. Dette scenarie ligner det, der blev præsenteret i det nuværende avancerede system20 , hvor lyden op til 1 kHz blev kontrolleret, selv om den opnåede forbedring her er over et meget bredere frekvensområde, nemlig op til 6 kHz. Det er værd at bemærke, at testene stadig blev udført på hver side separat i stedet for at blive taget samtidig i dette tilfælde.

Figur 4
figur4

Tre konfigurationer af de primære højttalere og den tilsvarende SPL (dB re. 20 μPa) med og uden ANC ved begge ører. (a) En enkelt primær højttaler blev anvendt til at simulere lyden fra en enkelt kilde i nærheden. (b) To primære højttalere blev anvendt til at simulere to lydkilder i nærheden eller en enkelt lydkilde med en reflekterende overflade i nærheden. (c) Fire primære højttalere blev anvendt til at simulere lyd fra flere retninger, hvilket tilnærmelsesvis svarer til et generelt tilfælde i praksis.

Figur 4b viser opsætningen og resultaterne fra en situation, hvor to primære højttalere blev placeret vilkårligt på to forskellige steder. Dette kan repræsentere en situation, hvor brugeren befinder sig tæt på en stor stiv reflekterende overflade, som f.eks. et bord eller en væg. I dette tilfælde er de akustiske signaler fra den oprindelige kilde og reflektoren kohærente. Der blev opnået en dæmpning på ca. 13 dB, og de samlede SPL’er blev reduceret fra 80,2 dB og 77,9 dB til 66,0 dB og 65,2 dB ved henholdsvis venstre og højre øre. Figur 4c viser en mere generel situation, hvor der findes flere reflektorer. Fire primære højttalere blev vilkårligt placeret på forskellige steder omkring hovedet for at opnå dette. Der blev opnået en dæmpning på ca. 11 dB, idet den samlede SPL blev reduceret fra 80,4 dB til 68,9 dB og fra 80,1 dB til 69,4 dB ved henholdsvis venstre og højre øre. I alle disse tre eksempelscenarier gav det demonstrerede system en reduktion på mindst 10 dB over hele frekvensområdet fra 500 Hz til 6 kHz. Det er værd at bemærke, at placeringen af disse primære kilder blev skabt vilkårligt, men de observerede kontrolpræstationer forventes dog at være ens for enhver anden lignende konfiguration.

Evaluering af ydeevne for syntetisk miljøstøj

For yderligere at demonstrere den foreslåede løsnings evne blev ydeevnen i tilstedeværelsen af tre forskellige typer forudindspillede scenarier med almindelig miljøstøj vurderet. I lighed med den konfiguration, der blev gennemført for nylig20 , var den primære kilde placeret ca. 1,2 m direkte bag HATS’en, og kun én kanal (højre øre) blev kontrolleret. De tre eksperimenter blev udført i et hemi-anechoisk kammer. For det første blev der anvendt en optagelse af flyintern støj29 som det primære kildesignal. De 15-signaler, der blev observeret af HATS før og efter ANC, er vist i fig. 5a med de tilsvarende spektrer som gennemsnit over denne varighed også vist. Den samlede SPL blev reduceret betydeligt fra 74,7 dB til 59,6 dB – en forbedring på mere end 15 dB. For det andet blev der undersøgt et eksempel på flyby-støj fra et fly30 . Figur 5b viser det tidsdomænesignal, der er observeret af HATS for en sådan ikke-stationær støj før og efter ANC, samt spektret (kun med et gennemsnit fra 3 til 8 s). Igen var der en betydelig reduktion i området fra 500 Hz til 6 kHz. Der, hvor støjen var mest udtalt, dvs. fra 3 til 8 s, blev det samlede SPL reduceret fra ca. 82,1 dB til 61,6 dB – en lyddæmpning på mere end 20 dB. Endelig blev en optagelse af en menneskemængde, der taler, anvendt som det primære kildesignal31 . Figur 5c viser 15-signalerne i tidsdomænet og frekvensdomænet før og efter ANC igen. Den samlede SPL blev kontrolleret fra 75,5 til 59,8 dB; der blev opnået en reduktion på over 15 dB. Tabel 1 opsummerer de gennemsnitlige samlede SPL’er uden og med kontrol ved hjælp af det foreslåede system for disse nye scenarier, hvor der kan opnås en støjreduktion på 15-20 dB op til 6 kHz ved hjælp af det foreslåede system. Lydoptagelserne før og efter ANC kan opleves gennem supplerende film 1. Det er vigtigt at bemærke, at den nuværende avancerede virtuelle ANC-løsning med virtuel sensorisk ANC, som har en ydelse ved den øvre frekvens på ca. 1 kHz, ikke ville give en så imponerende ydelse som den virtuelle ANC-hovedtelefon, der præsenteres her, da den, som det kan ses i fig. 5, findes det mere signifikante frekvensindhold i alle tre eksempelsignaler primært i intervallet 2 til 4 kHz.

Figur 5
Figur5

Tidsdomænesignalet observeret af HATS og det tilsvarende lydtryksniveau (dB re. 20 μPa) uden og med ANC for (a) støj fra et flys indre rum, (b) støj fra et flys forbiflyvning og (c) omgivende støj fra folk, der taler.

Tabel 1 Den gennemsnitlige samlede SPL uden og med det foreslåede ANC-system for tre typer syntetisk eksempel på primær støj fra omgivelserne.

Evaluering af ydeevne ved tilstedeværelse af hovedbevægelse

En person er tilbøjelig til at udvise kontinuerlig hovedbevægelse, og derfor bør sonde-laserstrålen fra LDV’en være i stand til at følge den tilsvarende vilkårlige bevægelse af membranen i ørerne. Sådanne LDV-løsninger til sporing er blevet undersøgt, udviklet og anvendt i vid udstrækning til mange komplekse måleopgaver26; scenariet her udgør endnu en interessant anvendelse. Der blev derfor gennemført et simpelt sporingssystem for at demonstrere beviset for konceptet. Dette skræddersyede kamerabaserede sporingssystem er vist i fig. 6 med specifikationer, der præsenteres i underafsnittet Metoder – Hovedsporingssystem. Det scenarie, der er anvendt her, er det samme som det, der er beskrevet i fig. 4a, dvs. det med en enkelt lydkilde umiddelbart bagved.

Figur 6
figur6

(a) Konfiguration af head tracking-systemet med en enkelt primær højttaler. Tracking-systemet og LDV’en er placeret til venstre for hovedet. (b) Opbygningen af tracking-systemet med et panoreringsspejl og et tiltspejl til styring af laserstrålen. Kameraet er fastgjort til styringen til sporing af målobjektet. (c) En gul markør er placeret under membranen på øreflippen som målobjekt. (d) Skematisk fremstilling af det kamerabaserede sporingssystem, der viser laserstrålens bane fra den scannende LDV.

Bevægelsen af en markør på HATS’ øreflip, som illustreret i fig. 6c, blev bestemt af det billedbehandlingsbaserede sporingssystem for at opretholde et næsten optimalt laserstråleindfald på membranen og give et brugbart fejlsignal. Supplerende figur S3 og de tilhørende bemærkninger viser virkningerne af off-center-målinger og forskellige indfaldsvinkler for laserstrålen på systemets ydeevne. Generelt set var ydeevnen ikke særlig følsom over for laserstrålens præcise placering på membranen, og det blev derfor ikke anset for nødvendigt, at laserstrålens indfaldszone var præcist i det geometriske centrum. Med laserstrålen lidt forskudt fra midten opretholdes ANC-ydelsen. Desuden havde laserstrålens indfaldsvinkel ingen væsentlig indflydelse på ydeevnen. Ved en indfaldsvinkel på bemærkelsesværdige 60 grader falder LDV-signalet med ca. 5 dB, hvilket igen har en minimal skadelig virkning på ANC-ydelsen. Disse egenskaber har lagt grunden til en vellykket anvendelse af sporingssystemet til håndtering af uundgåelige hovedbevægelser hos brugeren.

Figur 7 viser fire kontrolpræstationer – når ANC er slukket (1) og tændt (2) for en stationær HATS, og når ANC er tændt med hovedsporingssystemet deaktiveret (3) og aktiveret (4) for en HATS i bevægelse. HATS’ bevægelse blev implementeret manuelt med en frem- og tilbageskridtbevægelse, der blev brugt til at simulere en person, der bevæger sig frem og tilbage, mens han sidder ned. Den maksimale afstand, som HATS’en tilbagelagde i Supplementary Movie 2, var ca. 0,08 m fra top til top med en maksimal hastighed på ca. 0,04 m/s. Figur 7a viser et 15-stikprøveeksempel af tidsdomænemålingerne for hvert tilfælde med den samme konfiguration som i fig. 4a. Figur 7b viser det tilsvarende gennemsnitlige frekvensspektrum for hvert tilfælde for hele varigheden. I lighed med de tidligere præsenterede resultater i figur 4a blev det samlede SPL reduceret fra 81,1 til 64,1 dB i frekvensområdet fra 500 Hz til 6 kHz-området for den stationære situation.

Figur 7
figur7

ANC-præstationer med det udviklede hovedsporingssystem. (a) Fire 15-samples af tidsdomænesignalet observeret af HATS. Den øverste 30 s varighed viser lydtrykket med ANC slukket og tændt for den stationære situation, mens den nederste 30 s varighed viser lydtrykket med ANC tændt med sporingssystemet slukket og tændt for en HATS i bevægelse. (b) Det tilsvarende lydtryksniveau (dB re. 20 μPa) for de fire signaler.

Når HATS bevægede sig med ANC tændt, men med tracking slået fra, bevægede hovedet (og dermed membranen) sig væk fra sondens laserstråle; LDV-signalet “faldt derved ud” eller lavede en vibrationsmåling, der ikke var repræsentativ for lydtrykket ved øret. Dette kan let få kontrolsystemet til at afvige, og som det fremgår af fig. 7b, steg det samlede SPL faktisk betydeligt fra 81,1 til 99,5 dB. Når sporingssystemet var aktiveret, opretholdt spejlene laserstrålens indfald på membranen, mens HATS bevægede sig. LDV-målingen var således fortsat gyldig for den adaptive styring. Som det fremgår af fig. 7b, reducerede systemet lyden fra 81,1 til 70,4 dB over hele frekvensområdet. Kontrolpræstationen opretholdt en reduktion på mindst 10 dB under HATS’ bevægelse, hvilket viser, at det er nødvendigt at anvende et sporingssystem til ANC-systemet. Igen kan disse lydoptagelser opleves i Supplementary Movie 2.