La progettazione del sistema e i risultati della successiva indagine sperimentale sono organizzati in cinque sottosezioni. Inizialmente, viene descritto il design del sistema della cuffia ANC virtuale. Successivamente, viene esaminata la posizione della membrana per le migliori prestazioni di controllo. In terzo luogo, le prestazioni ANC in presenza di rumore grigio a banda larga sono determinate con il sistema implementato su un simulatore di testa e torso (HATS). Infine, le prestazioni del sistema vengono valutate per diversi tipi di segnali di rumore ambientale sintetizzati nel mondo reale. Infine, l’uso di un semplice sistema di tracciamento della posizione di misurazione è incorporato per permettere di tollerare l’inevitabile movimento della testa dell’utente.

Design del sistema di cuffie ANC virtuale

La Fig. 1a mostra schematicamente i componenti del sistema proposto e la loro disposizione. Due altoparlanti secondari sono posizionati dietro la testa dell’utente (come sarebbero se integrati in un poggiatesta), uno su ogni lato per controllare il suono primario dall’ambiente circostante a ciascun orecchio e per mettere così l’utente in un ambiente più tranquillo. Un LDV è usato per determinare il segnale acustico all’ingresso del canale uditivo misurando la vibrazione superficiale di un piccolo pick-up a membrana leggero e retroriflettente situato nelle vicinanze. Mentre la Fig. 1a mostra due fasci laser in entrata, uno per ogni orecchio, una soluzione monoauricolare è considerata e descritta qui per brevità e chiarezza ma senza perdita di generalità per l’equivalente a due orecchie.

Figura 1
figura1

una cuffia ANC virtuale. (a) Una zona tranquilla è formata in ogni orecchio usando una coppia di altoparlanti secondari vicini per ridurre il suono nell’orecchio, il segnale di errore richiesto è determinato da una misurazione LDV della vibrazione di un piccolo pick-up a membrana situato vicino al canale uditivo. Il movimento dell’utente è gestito da un sistema di tracciamento basato su telecamera, che controlla attivamente gli specchi azionati da galvanometro per dirigere il raggio laser e mantenere la sua posizione sulla membrana. (b) Le posizioni degli altoparlanti secondari. Ogni altoparlante secondario genera segnali antirumore attraverso il controller ANC (non mostrato).

Per i sistemi ANC, una zona tranquilla è definita come una regione in cui si ottiene un’attenuazione del suono superiore a 10 dB, con la dimensione della zona che è circa un decimo della lunghezza d’onda del suono in un campo sonoro diffuso4. Quando la membrana è posizionata vicino al canale uditivo, è possibile creare una tale zona tranquilla intorno ad essa, riducendo così il suono che si propaga alla membrana timpanica (timpano). I due altoparlanti secondari qui presentati sono stati posizionati a 0,44 m di distanza l’uno dall’altro con un angolo azimutale di 45 gradi rivolto verso l’utente, come mostrato in Fig. 1b. Il controller prende la velocità di vibrazione superficiale della membrana da un LDV come segnale di errore per il controllo adattivo, i cui dettagli possono essere trovati nella sottosezione Metodi-Algoritmo di controllo del rumore.

I normali movimenti della testa possono essere accomodati da un sistema di tracciamento relativamente semplice basato su telecamera, delineato in Fig. 1a, che controlla attivamente una coppia di specchi ortogonali, guidati da galvanometro per mantenere l’incidenza del raggio laser della sonda sul centro della membrana. Attraverso l’applicazione di un algoritmo di elaborazione delle immagini su misura, il LDV può quindi ottenere a distanza il segnale di errore acustico in tempo reale.

La configurazione sperimentale è presentata in Fig. 2a. L’esperimento è stato eseguito in una stanza tranquilla con un livello di pressione sonora di fondo di 38,5 dBA (SPL ponderato A, dB re. 20 μPa). Un simulatore di testa e torso (HATS; Brüel and Kjær Tipo 4128-C) con simulatori dell’orecchio destro e sinistro è stato usato per misurare il suono che sarebbe stato sperimentato sui timpani nelle orecchie di un utente. La figura 2b mostra il design e la configurazione del pick-up a membrana usato in questo sistema. Il pick-up consiste in un pezzo di pellicola retroriflettente (3 M-Scotchlite Sheeting 761027), di 0,1 mm di spessore, teso sopra e aderito a un corto tubo cilindrico polimerico chiuso con un diametro di 9,2 mm, una profondità di 4,6 mm e una massa di circa 0,2 g. La combinazione risultante è quindi il meno invasiva possibile in termini di dimensioni e massa. La pellicola è stata utilizzata come membrana in modo da massimizzare il segnale ottico retrodiffuso in relazione al raggio laser in entrata, indipendentemente da un’incidenza non normale del raggio, il che è vantaggioso in presenza di inevitabili movimenti della testa. La membrana funziona in modo simile al diaframma di un microfono, convertendo la vibrazione meccanica indotta dalla pressione acustica in un segnale elettrico. Tuttavia, in questo caso, non ci sono né componenti elettronici all’interno (ad esempio, un preamplificatore per elaborare il segnale misurato), né la necessità di cablaggio per la trasmissione del segnale. Invece, il condizionamento e la conversione del segnale sono completati a distanza nell’optoelettronica LDV. I parametri dettagliati per il materiale retroriflettente e la risposta in frequenza del pick-up a membrana sono stati determinati e possono essere trovati nella Fig. S1 supplementare e nella Tabella S1 supplementare.

Figura 2
figura2

Sistemazione sperimentale per un HATS stazionario. (a) Due altoparlanti secondari sono stati posizionati dietro l’HATS per il controllo del suono. Più altoparlanti primari (tre mostrati) sono stati posizionati arbitrariamente per simulare il suono indesiderato da diverse direzioni. Il raggio laser della sonda dal LDV era diretto verso la membrana nell’orecchio. (b) Una membrana è stata posta vicino al canale uditivo dell’orecchio sintetico sinistro dell’HATS. Il LDV determina a distanza la velocità superficiale della membrana come segnale di errore per il controllore ANC.

Il sistema di acquisizione dati è in una posizione remota insieme al LDV nella disposizione proposta. Il LDV (Polytec PDV-100) ha una gamma di frequenza misurabile da 20 Hz a 22 kHz. L’LDV era montato su un treppiede, isolato dalle vibrazioni dall’HATS e dagli altoparlanti (Genelec 8010A). La frequenza di campionamento del controller ANC (Antysound TigerANC WIFI-Q) è stata impostata a 32 kHz, e le lunghezze dei filtri per entrambi i percorsi primario e secondario sono stati impostati a 1024 rubinetti. Va notato che l’algoritmo di controllo adattivo ha semplicemente preso il segnale di velocità della membrana misurato direttamente e ha cercato di minimizzarlo. Mentre il segnale di velocità potrebbe potenzialmente essere convertito in pressione sonora con qualche mezzo, questo non era necessario – il risultato sarebbe stato lo stesso se fosse stato il segnale grezzo o qualche derivato di esso.

Posizionamento ottimale del pick-up della membrana

Anche se è ovvio posizionare il pick-up della membrana il più vicino possibile al canale uditivo, non è immediatamente chiaro quale posizione specifica è più fattibile/ottima e quali potrebbero essere le prestazioni ANC per ciascuna. Quattro possibili posizioni di pick-up sono illustrate in Fig. 3, dove la posizione # 1 è sulla tacca anteriore del padiglione auricolare, la posizione # 2 è sul trago, la posizione # 3 è nella cavità concha, e la posizione # 4 è sul lobulo. Gli esperimenti sono stati eseguiti nell’orecchio sintetico sinistro dell’HATS. Solo un altoparlante, situato a 0,6 m di distanza direttamente sul retro dell’HATS, è stato utilizzato come sorgente primaria. Il segnale sorgente primaria era un rumore grigio a banda larga con un filtro personalizzato Fletcher-Munson curva 28 da 500 Hz a 6 kHz (vedi Fig. supplementare S2). Il filtro è stato applicato qui per produrre un SPL misurato con una risposta in frequenza piatta all’interno del HATS. L’SPL complessivo alla membrana timpanica sinistra era 77,7 dB (re. 20 μPa-omesso in seguito per brevità) con ANC off.

Figura 3
figura3

I SPL (dB re. 20 μPa) misurati dal simulatore dell’orecchio sinistro di un HATS, simulando il suono che un utente sperimenta alla membrana timpanica sinistra con e senza ANC, quando la membrana era in (a) posizione #1-anterior notch; (b) posizione #2-tragus; (c) posizione #3-cavum concha; e (d) posizione #4-lobule dell’orecchio sintetico sinistro HATS.

Con l’ANC attivato, le prestazioni nelle posizioni #1 e #2 erano simili con il risultante SPL complessivo di 69,2 dB e 70,9 dB, rispettivamente. Tuttavia, la riduzione del suono era significativa solo alle frequenze sotto i 4 kHz. La ragione può essere che le pressioni sonore misurate in questi due punti sono solo simili a quelle del canale uditivo sotto i 4 kHz. Quindi, le prestazioni di controllo in questi due punti sono anche limitate fino a 4 kHz. La riduzione del suono nel punto #3 è stata la migliore con un SPL complessivo di 63,5 dB quando ANC era attivo. L’SPL complessivo è stato ridotto di 14,2 dB su tutta la gamma di frequenza da 500 Hz a 6 kHz. La posizione #4, il lobulo, era più lontana dal canale uditivo rispetto a qualsiasi altra posizione selezionata. La gamma di frequenza effettiva della riduzione del suono era solo fino a circa 3 kHz con un aumento di circa 6 dB di fatto osservato nella gamma da 5 a 6 kHz. Sulla base dei risultati di questa analisi delle prestazioni della posizione della membrana, la posizione #3 (la cavità concha) è stata identificata come la posizione ottimale per la membrana; nelle restanti indagini sperimentali descritte qui, questa è quindi la posizione della membrana impiegata.

Valutazione delle prestazioni per il rumore a banda larga

La figura 4 mostra gli spettri di rumore misurati per ogni orecchio senza e con ANC per tre diversi scenari di campo sonoro primario. Gli altoparlanti pilotati con segnali comuni sono stati disposti in modo da creare ambienti sempre più complessi con uno o più riflettori. Il segnale usato era di nuovo il rumore grigio a banda larga equivalente a quello usato per ottenere i risultati presentati in Fig. 3. Tutti i risultati dei test sono stati ottenuti facendo la media su una lunghezza di dati di 15 secondi. La figura 4a mostra la configurazione in cui una singola sorgente primaria è stata posizionata a 0,6 m di distanza direttamente sul retro dell’HATS per simulare il suono proveniente da una sorgente vicina senza considerare alcuna riflessione dall’ambiente circostante. Dopo aver abilitato l’ANC, è stata realizzata un’attenuazione di quasi 15 dB con un SPL complessivo ridotto da 78,1 dB a 63,8 dB e da 77,3 dB a 62,0 dB rispettivamente all’orecchio sinistro e destro. Questo scenario è simile a quello presentato nell’attuale sistema all’avanguardia20, dove il suono fino a 1 kHz era controllato, anche se qui il miglioramento ottenuto è su una gamma di frequenza molto più ampia, fino a 6 kHz. Vale la pena notare che i test sono stati ancora eseguiti su ogni lato separatamente invece di essere presi simultaneamente in questo caso.

Figura 4
figura4

Tre configurazioni degli altoparlanti primari e il corrispondente SPL (dB re. 20 μPa) con e senza ANC a entrambe le orecchie. (a) Un singolo altoparlante primario è stato utilizzato per simulare il suono da una singola fonte vicina. (b) Due altoparlanti primari sono stati usati per simulare due fonti sonore vicine o una singola fonte sonora con una superficie riflettente vicina. (c) Quattro altoparlanti primari sono stati usati per simulare il suono da più direzioni, approssimando un caso generale nella pratica.

La figura 4b mostra la configurazione e i risultati di una situazione in cui due altoparlanti primari sono stati posizionati arbitrariamente in due luoghi diversi. Questo può rappresentare una situazione in cui l’utente è vicino a una grande superficie rigida riflettente, come un tavolo o una parete. In questo caso, i segnali acustici dalla sorgente originale e dal riflettore sono coerenti. È stata ottenuta un’attenuazione di circa 13 dB con SPL complessivi ridotti da 80,2 dB e 77,9 dB a 66,0 dB e 65,2 dB all’orecchio sinistro e destro, rispettivamente. La figura 4c mostra una situazione più generale in cui esistono più riflettori. Quattro altoparlanti primari sono stati posizionati arbitrariamente in vari punti intorno alla testa per ottenere questo risultato. È stata ottenuta un’attenuazione di circa 11 dB con un SPL complessivo ridotto da 80,4 dB a 68,9 dB e da 80,1 dB a 69,4 dB rispettivamente all’orecchio sinistro e destro. In tutti e tre questi scenari di esempio, il sistema dimostrato ha prodotto una riduzione minima di 10 dB su tutta la gamma di frequenza da 500 Hz a 6 kHz. Vale la pena notare che i posizionamenti di queste fonti primarie sono stati creati arbitrariamente, tuttavia, le prestazioni di controllo osservate dovrebbero essere simili per qualsiasi altra configurazione simile.

Valutazione delle prestazioni per il rumore ambientale sintetico

Per dimostrare ulteriormente la capacità della soluzione proposta, sono state valutate le prestazioni in presenza di tre diversi tipi di scenari di rumore ambientale comune preregistrato. Simile alla configurazione implementata di recente20, la sorgente primaria era situata a circa 1,2 m direttamente dietro l’HATS, con un solo canale (orecchio destro) controllato. I tre esperimenti sono stati eseguiti in una camera emi-anecoica. In primo luogo, una registrazione del rumore interno di un aereo29 è stata utilizzata come segnale sorgente primario. I segnali di 15 secondi osservati dall’HATS prima e dopo l’ANC sono mostrati in Fig. 5a con i corrispondenti spettri mediati su questa durata. L’SPL complessivo è stato significativamente ridotto da 74,7 dB a 59,6 dB, un miglioramento superiore a 15 dB. In secondo luogo, è stato esaminato un esempio di rumore di flyby di un aereo30 . La figura 5b mostra il segnale nel dominio del tempo osservato dall’HATS di tale rumore non stazionario prima e dopo l’ANC e lo spettro (mediato solo da 3 a 8 s). Ancora una volta, c’è stata una riduzione significativa nell’intervallo da 500 Hz a 6 kHz. Infatti, dove il rumore era più pronunciato, cioè da 3 a 8 s, l’SPL complessivo è stato ridotto da circa 82,1 dB a 61,6 dB – un’attenuazione del suono superiore a 20 dB. Infine, una registrazione di una folla di persone che parlano è stata utilizzata come segnale sorgente primario31. La Figura 5c mostra i segnali del dominio del tempo e della frequenza di 15 secondi prima e dopo l’ANC. L’SPL complessivo è stato controllato da 75,5 a 59,8 dB; è stata ottenuta una riduzione di oltre 15 dB. La tabella 1 riassume la media degli SPL complessivi senza e con controllo usando il sistema proposto per questi nuovi scenari, dove 15-20 dB di riduzione del rumore fino a 6 kHz possono essere raggiunti usando il sistema proposto. Le registrazioni audio prima e dopo ANC può essere sperimentato attraverso il filmato supplementare 1. È importante notare che l’attuale stato dell’arte virtuale rilevamento ANC soluzione, con una prestazione di frequenza superiore citato di circa 1 kHz, non produrrebbe come impressionante una performance come la cuffia virtuale ANC presentato qui in quanto, come si può osservare in Fig. 5, il contenuto di frequenza più significativo in tutti e tre i segnali di esempio esiste principalmente nella gamma da 2 a 4 kHz.

Figura 5
figura5

Il segnale nel dominio del tempo osservato dal HATS e il corrispondente livello di pressione sonora (dB re. 20 μPa) senza e con ANC per (a) il rumore interno degli aerei, (b) il rumore di sorvolo degli aerei e (c) il rumore ambientale di persone che parlano.

Tabella 1 L’SPL medio complessivo senza e con il sistema ANC proposto per tre tipi di rumore ambientale primario di esempio sintetico.

Valutazione delle prestazioni in presenza di movimento della testa

Una persona è incline a mostrare un continuo movimento della testa, quindi, il raggio laser della sonda LDV dovrebbe essere in grado di seguire il corrispondente movimento arbitrario della membrana nelle orecchie. Tali soluzioni LDV di tracciamento sono stati ampiamente ricercati, sviluppati e applicati per numerosi compiti di misurazione complessa26; lo scenario qui rappresenta un’ulteriore applicazione interessante. Un semplice sistema di tracciamento è stato quindi implementato per dimostrare la prova del concetto. Questo sistema di tracciamento basato su telecamera su misura è mostrato in Fig. 6 con le specifiche presentate nella sottosezione Metodi-Sistema di tracciamento della testa. Lo scenario usato qui è lo stesso di quello descritto in Fig. 4a, cioè quello con una singola sorgente sonora immediatamente dietro.

Figura 6
figura6

(a) Configurazione del sistema di head tracking con un singolo altoparlante primario. Il sistema di tracciamento e l’LDV sono posizionati sul lato sinistro della testa. (b) La costruzione del sistema di tracciamento con uno specchio pan e uno tilt per dirigere il raggio laser. La telecamera è attaccata al controller per l’inseguimento dell’oggetto da inseguire. (c) Un marcatore giallo è posto sotto la membrana sul lobulo dell’orecchio come oggetto target. (d) Schema del sistema di tracciamento basato su telecamera che mostra il percorso del raggio laser dalla scansione LDV.

Il movimento di un marcatore sul lobulo dell’orecchio del HATS, come illustrato in Fig. 6c è stato determinato dal sistema di tracciamento basato sull’elaborazione delle immagini per mantenere quasi ottimale incidenza del raggio laser sulla membrana e produrre un segnale di errore utile. Figura supplementare S3 e le osservazioni associate presentano gli effetti delle misurazioni fuori centro e diversi angoli di incidenza del fascio laser sulle prestazioni del sistema. Nel complesso, le prestazioni non erano particolarmente sensibili alla posizione precisa del fascio laser sulla membrana, con quindi ritenuto non necessario per l’incidenza del fascio laser per essere esattamente al centro geometrico. Con il raggio laser leggermente decentrato, le prestazioni ANC sono mantenute. Inoltre, l’angolo di incidenza del raggio laser non ha influenzato significativamente le prestazioni. Con l’incidenza ad un notevole 60 gradi, il segnale LDV scende di circa 5 dB, il che, ancora una volta, ha un effetto negativo minimo sulle prestazioni ANC. Queste caratteristiche hanno gettato le basi per l’applicazione di successo del sistema di tracciamento per gestire gli inevitabili movimenti della testa dell’utente.

La figura 7 mostra quattro prestazioni di controllo – quando ANC è spento (1) e acceso (2) per un HATS fermo e quando ANC è acceso con il sistema di tracciamento della testa disattivato (3) e attivato (4) per un HATS in movimento. Il movimento dell’HATS è stato implementato manualmente con un movimento avanti-indietro usato per simulare una persona che si muove avanti e indietro mentre è seduta. La distanza massima percorsa dall’HATS nel filmato supplementare 2 era di circa 0,08 m da picco a picco con una velocità massima di circa 0,04 m/s. La Figura 7a mostra il campione di 15-s della misurazione nel dominio del tempo per ogni caso con la stessa configurazione della Fig. 4a. La figura 7b mostra il corrispondente spettro di frequenza medio per ogni caso per l’intera durata. Simile ai risultati precedentemente presentati in Fig. 4a, l’SPL totale è stato ridotto da 81,1 a 64,1 dB nella gamma di frequenza da 500 Hz a 6 kHz per la situazione stazionaria.

Figura 7
figura7

PrestazioniANC con il sistema di tracciamento della testa sviluppato. (a) Quattro campioni di 15 s del segnale nel dominio del tempo osservato dall’HATS. La durata superiore di 30 s mostra la pressione sonora con ANC off e on per la situazione stazionaria, mentre la durata inferiore di 30 s mostra la pressione sonora con ANC on con il sistema di tracciamento off e on per un HATS in movimento. (b) Il corrispondente livello di pressione sonora (dB re. 20 μPa) dei quattro segnali.

Quando l’HATS si muoveva con ANC acceso ma con tracking disattivato, la testa (quindi la membrana) si allontanava dal raggio laser della sonda; il segnale LDV quindi “cadeva” o faceva una misura di vibrazione non rappresentativa della pressione sonora all’orecchio. Questo può facilmente far divergere il sistema di controllo e, come mostrato in Fig. 7b, l’SPL complessivo è infatti aumentato significativamente da 81,1 a 99,5 dB. Quando il sistema di tracciamento era abilitato, gli specchi mantenevano l’incidenza del raggio laser sulla membrana mentre l’HATS si muoveva. Così, la misura LDV è rimasta valida per il controllo adattivo. Come mostrato in Fig. 7b, il sistema ha ridotto il suono da 81,1 a 70,4 dB su tutta la gamma di frequenza. Le prestazioni del controllo hanno mantenuto almeno una riduzione di 10 dB durante il movimento dell’HATS, dimostrando la necessità di utilizzare un sistema di tracciamento per il sistema ANC. Ancora una volta, queste registrazioni audio possono essere vissute nel filmato supplementare 2.

.