O desenho do sistema e os resultados da investigação experimental subsequente estão organizados em cinco subsecções. Inicialmente, é descrito o projeto do sistema de fone de ouvido ANC virtual. Em seguida, é examinada a localização da membrana para o melhor desempenho do controle. Em terceiro lugar, o desempenho do ANC na presença de ruído cinza de banda larga é determinado com o sistema implementado em um simulador de cabeça e tronco (HATS). Penúltimo, o desempenho do sistema é então avaliado para diferentes tipos de sinais de ruído ambiental sintetizados no mundo real. Finalmente, o uso de um sistema simples de rastreamento do local de medição é incorporado para permitir que o movimento inevitável da cabeça do usuário seja tolerado.

Concepção do sistema de fones de ouvido ANC virtual

Um esquema mostrando os componentes propostos do sistema e sua disposição é mostrado na Fig. 1a. Dois alto-falantes secundários são colocados atrás da cabeça do usuário (como seriam se integrados em um encosto de cabeça), um de cada lado para controlar o som primário do ambiente ao redor de cada ouvido e assim colocar o usuário em um ambiente mais silencioso. Um LDV é usado para determinar o sinal acústico na entrada do canal auditivo, medindo a vibração superficial de uma pequena membrana retrorreflectora, leve e localizada nas proximidades. Enquanto a figura 1a mostra dois feixes de laser de entrada, um para cada orelha, uma solução de uma orelha é considerada e descrita aqui por uma questão de brevidade e clareza, mas sem perda de generalidade para o equivalente a duas orelhas.

Figure 1
figure1

Um fone de ouvido ANC virtual. (a) Uma zona silenciosa é formada em cada ouvido usando um par de alto-falantes secundários próximos para reduzir o som no ouvido, sendo o sinal de erro necessário determinado a partir de uma medição LDV da vibração de um pequeno captador de membrana localizado próximo ao canal auditivo. O movimento do usuário é acomodado por um sistema de rastreamento baseado em câmera, que controla ativamente os espelhos acionados por galvanômetro para direcionar o feixe laser e manter sua posição sobre a membrana. (b) A localização dos altifalantes secundários. Cada alto-falante secundário gera sinais anti-ruído através do controlador ANC (não mostrado).

Para sistemas ANC, uma zona silenciosa é definida como uma região na qual mais de 10 dB de atenuação sonora é alcançada, sendo o tamanho da zona cerca de um décimo do comprimento de onda do som em um campo sonoro difuso4. Quando a membrana é colocada perto do canal auditivo, essa zona silenciosa pode ser criada ao seu redor, reduzindo assim a propagação do som para a membrana timpânica (tímpano). Os dois altifalantes secundários aqui apresentados foram colocados a 0,44 m de distância, com um ângulo de azimute de 45 graus, apontando para o utilizador, como mostra a Fig. 1b. O controlador toma a velocidade de vibração superficial da membrana de um LDV como sinal de erro para o controle adaptativo, cujos detalhes podem ser encontrados na subseção Métodos- Algoritmo de controle de ruído.

Movimentos da cabeça normal podem ser acomodados por um sistema de rastreamento relativamente simples baseado em câmera, delineado na Fig. 1a, que controla ativamente um par de espelhos ortogonais acionados por galvanômetro para manter a incidência do feixe laser da sonda no centro da membrana. Através da aplicação de um algoritmo de processamento de imagem sob medida, o LDV pode assim obter remotamente o sinal de erro acústico em tempo real.

A configuração experimental é apresentada na Fig. 2a. O experimento foi realizado em uma sala silenciosa com um nível de pressão sonora de fundo de 38,5 dBA (SPL ponderado A, dB re. 20 μPa). Um simulador de cabeça e tronco (HATS; Brüel e Kjær Tipo 4128-C) com simuladores de ouvido direito e esquerdo foi usado para medir o som que seria experimentado nos tímpanos dos ouvidos de um usuário. A Figura 2b mostra o design e a configuração da captação de membrana utilizada neste sistema. A pick-up consiste em um pedaço de filme retrorrefletivo (3 M-Scotchlite Sheeting 761027), de 0,1 mm de espessura, esticado e aderido a um tubo cilíndrico polimérico curto e fechado com 9,2 mm de diâmetro, 4,6 mm de profundidade e uma massa de aproximadamente 0,2 g. A combinação resultante é, portanto, tão minimamente invasiva quanto praticamente possível em termos de tamanho e massa. A película foi utilizada como membrana de modo a maximizar o sinal óptico invertido em relação ao raio laser de entrada, independentemente de uma incidência de raio não normal, sendo esta vantagem na presença de movimentos inevitáveis da cabeça. A membrana funciona de forma semelhante a um diafragma de microfone, convertendo a pressão acústica induzida pela vibração mecânica em última instância em um sinal elétrico. No entanto, neste caso, não há nenhum componente eletrônico no interior (por exemplo, um pré-amplificador para processar o sinal medido), nem a necessidade de fiação para a transmissão do sinal. Ao invés disso, o condicionamento e a conversão do sinal são realizados remotamente na opto-eletrônica LDV. Os parâmetros detalhados para o material retrorreflector e a resposta de frequência da recolha da membrana foram determinados e podem ser encontrados na Fig. S1 e na Tabela Suplementar S1.

Figure 2
>

>

figure2

Configuração experimental para um HATS estacionário. (a) Dois alto-falantes secundários foram colocados atrás dos HATS para o controle do som. Vários alto-falantes primários (três mostrados) foram localizados arbitrariamente para simular som indesejado de diferentes direções. O raio laser da sonda do LDV foi direcionado para a membrana do ouvido. (b) Uma membrana foi colocada perto do canal auditivo do ouvido sintético esquerdo do HATS. O LDV determina remotamente a velocidade superficial da membrana como sinal de erro para o controlador ANC.

O sistema de aquisição de dados está em um local remoto junto com o LDV no arranjo proposto. O LDV (Polytec PDV-100) tem uma gama de frequência mensurável de 20 Hz a 22 kHz. O LDV foi montado sobre um tripé, vibração isolada dos HATS e dos alto-falantes (Genelec 8010A). A taxa de amostragem do controlador ANC (Antysound TigerANC WIFI-Q) foi ajustada para 32 kHz, e os comprimentos dos filtros para os caminhos primário e secundário foram ajustados para 1024 toques. Deve-se notar que o algoritmo de controle adaptativo simplesmente tomou o sinal de velocidade da membrana medida diretamente e tentou minimizá-lo. Embora o sinal de velocidade pudesse potencialmente ser convertido em pressão sonora por algum meio, isto não era necessário – o resultado seria o mesmo quer fosse o sinal bruto ou algum derivado dele.

Optimização da captação da membrana

Embora seja óbvio colocar a captação da membrana o mais próximo possível do canal auditivo, não é imediatamente claro qual a localização específica/s era mais viável/ótima e qual o desempenho do ANC para cada uma delas. Quatro possíveis locais de captação são ilustrados na Fig. 3, onde a localização #1 está no entalhe anterior do pinna, a localização #2 está no trago, a localização #3 está na concha cavum, e a localização #4 está no lobulo. Os experimentos foram realizados no ouvido sintético esquerdo do HATS. Apenas um altifalante, localizado a 0,6 m de distância directamente para a parte de trás da HATS, é usado aqui como fonte primária. O sinal da fonte primária era um ruído cinzento de banda larga com um filtro de curva Fletcher-Munson personalizado28 de 500 Hz a 6 kHz (ver figura suplementar S2). O filtro foi aplicado aqui para produzir um SPL medido com uma resposta de frequência plana dentro do HATS. O SPL global na membrana timpânica esquerda foi de 77,7 dB (re. 20 μPa – doravante designado por brevidade) com ANC desligado.

Figure 3
figure3

Os SPLs (dB re. 20 μPa) medido a partir do simulador de ouvido esquerdo de um HATS, simulando o som que um usuário experimenta na membrana timpânica esquerda com e sem ANC, quando a membrana estava no (a) local #1-anterior do entalhe; (b) local #2-tragus; (c) local #3-cavum concha; e (d) local #4-lóbulo do ouvido sintético esquerdo do HATS.

Com o ANC ligado, as performances nos locais #1 e #2 foram semelhantes, sendo o SPL global resultante 69,2 dB e 70,9 dB, respectivamente. No entanto, a redução do som só foi significativa em frequências abaixo de 4 kHz. A razão pode ser que as pressões sonoras medidas nestes dois pontos são apenas semelhantes às do canal auditivo abaixo de 4 kHz. Assim, as performances de controlo nos dois pontos também são limitadas até 4 kHz. A redução do som no local #3 foi a melhor com um SPL global de 63,5 dB quando o ANC estava ligado. O SPL global foi reduzido em 14,2 dB em toda a gama de frequências de 500 Hz a 6 kHz. A localização #4, o lóbulo, estava mais longe do canal auditivo do que qualquer um dos outros locais selecionados. A faixa de freqüência efetiva da redução do som foi apenas até aproximadamente 3 kHz com um aumento de aproximadamente 6 dB observado de fato na faixa de 5 a 6 kHz. Com base nos resultados desta análise de desempenho de localização da membrana, a localização #3 (a concha cavum) foi identificada como a localização ótima para a membrana; nas demais investigações experimentais aqui descritas, esta é, portanto, a posição da membrana empregada.

Avaliação de desempenho para ruído de banda larga

Figure 4 mostra os espectros de ruído medidos para cada orelha sem e com ANC para três diferentes cenários de campo sonoro primário. Alto-falantes com sinais comuns foram organizados para criar ambientes cada vez mais complexos com um ou vários refletores. O sinal utilizado foi novamente o ruído cinza de banda larga equivalente ao utilizado para obter os resultados apresentados na Fig. 3. Todos os resultados dos testes foram obtidos calculando a média de um comprimento de dados de 15-s. A Figura 4a mostra a configuração onde uma única fonte primária estava localizada a 0,6 m de distância diretamente para a parte traseira do HATS para simular o som vindo de uma fonte próxima sem considerar qualquer reflexão do ambiente. Depois de ativar o ANC, quase 15 dB de atenuação foi realizado com o SPL global sendo reduzido de 78,1 dB para 63,8 dB e de 77,3 dB para 62,0 dB nas orelhas esquerda e direita respectivamente. Este cenário é semelhante ao apresentado no actual sistema de última geração20 , onde o som até 1 kHz foi controlado, embora aqui a melhoria alcançada seja numa gama de frequências muito mais ampla, até 6 kHz. Vale notar que os testes ainda foram realizados em cada lado separadamente ao invés de serem realizados simultaneamente neste caso.

Figure 4
figure4

Três configurações de alto-falantes primários e o SPL correspondente (dB re. 20 μPa) com e sem ANC em ambos os ouvidos. (a) Um único altifalante primário foi utilizado para simular o som de uma única fonte próxima. (b) Dois alto-falantes primários foram usados para simular duas fontes sonoras nas proximidades ou uma única fonte sonora com uma superfície reflectora próxima. (c) Quatro alto-falantes primários foram usados para simular o som de várias direções, aproximando-se de um caso geral na prática.

Figure 4b mostra a configuração e os resultados de uma situação em que dois alto-falantes primários foram colocados arbitrariamente em dois locais diferentes. Isto pode representar uma situação em que o utilizador está próximo de uma grande superfície reflectora rígida, tal como uma mesa ou uma parede. Neste caso, os sinais acústicos da fonte original e do reflector são coerentes. Foi obtida uma atenuação de aproximadamente 13 dB com a redução dos SPLs globais de 80,2 dB e 77,9 dB para 66,0 dB e 65,2 dB nas orelhas esquerda e direita, respectivamente. A Figura 4c mostra uma situação mais geral onde existem reflectores múltiplos. Quatro alto-falantes primários foram arbitrariamente posicionados em vários locais ao redor da cabeça para conseguir isso. Aproximadamente 11 dB de atenuação foram obtidos com o SPL global reduzido de 80,4 dB para 68,9 dB e de 80,1 dB para 69,4 dB no ouvido esquerdo e direito, respectivamente. Em todos estes três cenários de exemplo, o sistema demonstrado produziu uma redução mínima de 10 dB em toda a faixa de frequência de 500 Hz a 6 kHz. Vale ressaltar que as colocações dessas fontes primárias foram criadas arbitrariamente, entretanto, espera-se que o desempenho do controle observado seja similar para qualquer outra configuração similar.

Avaliação de desempenho para ruído ambiental sintético

Para demonstrar ainda mais a capacidade da solução proposta, foi avaliado o desempenho na presença de três tipos diferentes de cenários de ruído ambiental comum pré-gravado. Semelhante à configuração implementada recentemente20 , a fonte primária foi localizada cerca de 1,2 m diretamente atrás do HATS, com apenas um canal (ouvido direito) sendo controlado. Os três experimentos foram realizados em uma câmara hemi-anecóica. Em primeiro lugar, foi utilizado um registo do ruído interior da aeronave29 como sinal da fonte primária. Os sinais de 15-s observados pelos HATS antes e depois do ANC são mostrados na Fig. 5a, com os espectros correspondentes a esta duração também mostrados em média. O SPL global foi significativamente reduzido de 74,7 dB para 59,6 dB – uma melhoria superior a 15 dB. Em segundo lugar, um exemplo de ruído de voo de uma aeronave30 foi examinado. A Figura 5b mostra o sinal de domínio temporal observado pelo HATS de tal ruído não estacionário antes e depois do ANC e o espectro (média de 3 a 8 s apenas). Mais uma vez, houve uma redução significativa na faixa de 500 Hz a 6 kHz. De facto, onde o ruído foi o mais pronunciado, ou seja, de 3 a 8 s, o SPL global foi reduzido de cerca de 82,1 dB para 61,6 dB – uma atenuação sonora superior a 20 dB. Finalmente, a gravação de uma multidão de pessoas a falar foi utilizada como sinal de fonte primária31. A Figura 5c mostra novamente os sinais de 15-s de domínio temporal e de frequência antes e depois do ANC. O SPL global foi controlado de 75,5 a 59,8 dB; foi alcançada uma redução superior a 15 dB. A Tabela 1 resume as SPLs globais médias sem e com controle usando o sistema proposto para estes novos cenários, onde a redução de ruído de 15-20 dB até 6 kHz pode ser conseguida usando o sistema proposto. As gravações de áudio antes e depois do ANC podem ser experimentadas através do Filme Complementar 1. É importante notar que a solução atual de sensoriamento virtual ANC de última geração, com um desempenho de freqüência superior citado de cerca de 1 kHz, não produziria um desempenho tão impressionante quanto o fone de ouvido ANC virtual aqui apresentado já que, como pode ser observado na Fig. 5, o conteúdo de frequência mais significativo nos três sinais de exemplo existe principalmente na faixa de 2 a 4 kHz.

Figure 5
figure5

O sinal de domínio temporal observado pelo HATS e o nível de pressão sonora correspondente (dB re. 20 μPa) sem e com ANC para (a) ruído interior de aeronaves, (b) ruído de voo de aeronaves e (c) ruído ambiente de pessoas falando.

Tabela 1 O SPL geral médio sem e com sistema ANC proposto para três tipos de exemplo sintético de ruído ambiental primário.
>

Avaliação de desempenho na presença de movimento da cabeça

Uma pessoa é propensa a exibir movimento contínuo da cabeça, portanto, o feixe laser da sonda do LDV deve ser capaz de rastrear o movimento arbitrário correspondente da membrana nos ouvidos. Tais soluções de rastreamento LDV têm sido amplamente pesquisadas, desenvolvidas e aplicadas para inúmeras tarefas de medição complexas26; o cenário aqui representa uma aplicação mais interessante. Um sistema simples de rastreamento foi, portanto, implementado para demonstrar a prova de conceito. Este sistema de rastreamento baseado em câmera sob medida é mostrado na Fig. 6 com especificações apresentadas na subseção Métodos-Sistema de rastreamento de cabeça. O cenário utilizado aqui é o mesmo que o descrito na Fig. 4a, ou seja, aquele com uma única fonte sonora imediatamente atrás.

Figure 6
figure6

(a) Configuração do sistema de rastreamento da cabeça com um único alto-falante primário. O sistema de rastreamento e o LDV são colocados no lado esquerdo da cabeça. (b) A construção do sistema de rastreamento com uma bandeja e um espelho inclinado para direcionar o feixe de laser. A câmara é ligada ao controlador para o rastreio do objecto alvo. (c) Um marcador amarelo é colocado abaixo da membrana no lóbulo da orelha como o objeto alvo. (d) Esquema do sistema de rastreamento baseado na câmera mostrando a trajetória do feixe laser a partir do escaneamento LDV.

O movimento de um marcador no lóbulo da orelha do HATS, como ilustrado na Fig. 6c foi determinado pelo sistema de rastreamento baseado no processamento da imagem para manter a incidência do feixe laser quase ideal na membrana e produzir um sinal de erro útil. A Figura S3 suplementar e as observações associadas apresentam os efeitos das medições fora do centro e diferentes ângulos de incidência do feixe laser sobre o desempenho do sistema. Em geral, o desempenho não foi particularmente sensível à localização precisa do feixe laser na membrana, pelo que não foi considerado necessário para que a incidência do feixe laser fosse precisamente no centro geométrico. Com o feixe laser ligeiramente descentrado, o desempenho do ANC é mantido. Além disso, o ângulo de incidência do feixe laser não afetou significativamente o desempenho. Com uma incidência de 60 graus bastante notável, o sinal LDV cai cerca de 5 dB, o que, mais uma vez, tem um efeito prejudicial mínimo sobre o desempenho do ANC. Estas características lançaram as bases para a aplicação bem sucedida do sistema de rastreamento para gerenciar os inevitáveis movimentos da cabeça do usuário.

Figure 7 mostra quatro desempenhos de controle – quando o ANC está desligado (1) e ligado (2) para um HATS estacionário e quando o ANC está ligado com o sistema de rastreamento da cabeça desligado (3) e habilitado (4) para um HATS em movimento. O movimento do HATS foi implementado manualmente com um movimento para a frente e para trás utilizado para simular uma pessoa a mover-se para trás e para a frente enquanto sentada. A distância máxima percorrida pelos HATS no Filme Complementar 2 foi de aproximadamente 0,08 m de pico a pico com uma velocidade máxima de cerca de 0,04 m/s. A Figura 7a mostra a amostra de 15-s da medição do domínio do tempo para cada caso com a mesma configuração que na Fig. 4a. A Figura 7b mostra o espectro de frequência média correspondente para cada caso durante toda a sua duração. Similar aos resultados apresentados anteriormente na Figura 4a, o SPL total foi reduzido de 81,1 para 64,1 dB na faixa de frequência de 500 Hz para 6 kHz para a situação estacionária.

Figure 7
figure7

ANC performance com o sistema de head tracking desenvolvido. (a) Quatro amostras de 15-s do sinal de domínio temporal observado pela HATS. A duração superior de 30 s mostra a pressão sonora com ANC ligado e desligado para a situação estacionária, enquanto que a duração inferior de 30 s mostra a pressão sonora com ANC ligado e desligado para um HATS em movimento. (b) O nível de pressão sonora correspondente (dB re. 20 μPa) dos quatro sinais.

Quando o HATS se movia com o ANC ligado mas com o rastreamento desativado, a cabeça (portanto a membrana) afastava-se do feixe laser da sonda; o sinal LDV assim “descia” ou fazia uma medição de vibração não representativa da pressão sonora no ouvido. Isto pode facilmente fazer o sistema de controle divergir e, como mostrado na Fig. 7b, o SPL global de fato aumentou significativamente de 81,1 para 99,5 dB. Quando o sistema de rastreamento foi habilitado, os espelhos mantiveram a incidência do feixe laser na membrana à medida que o HATS se movia. Assim, a medição do LDV permaneceu válida para o controle adaptativo. Como mostrado na Fig. 7b, o sistema reduziu o som de 81,1 para 70,4 dB em toda a faixa de frequência. O desempenho do controle manteve uma redução de pelo menos 10 dB durante o movimento do HATS, demonstrando a necessidade de utilizar um sistema de rastreamento para o sistema ANC. Novamente, estas gravações de áudio podem ser experimentadas no Filme Complementar 2.