El diseño del sistema y los resultados de la investigación experimental posterior se organizan en cinco subsecciones. En primer lugar, se describe el diseño del sistema del auricular virtual ANC. Posteriormente, se examina la ubicación de la membrana para obtener el mejor rendimiento de control. En tercer lugar, se determina el rendimiento del ANC en presencia de ruido gris de banda ancha con el sistema implementado en un simulador de cabeza y torso (HATS). Por último, se evalúa el rendimiento del sistema para diferentes tipos de señales de ruido ambiental sintetizadas en el mundo real. Por último, se incorpora el uso de un sencillo sistema de seguimiento de la ubicación de las mediciones para poder tolerar el inevitable movimiento de la cabeza del usuario.

Diseño del sistema de auriculares ANC virtual

En la Fig. 1a se muestra un esquema con los componentes del sistema propuesto y su disposición. Se colocan dos altavoces secundarios detrás de la cabeza del usuario (como lo harían si estuvieran integrados en un reposacabezas), uno a cada lado para controlar el sonido primario del entorno circundante en cada oído y situar así al usuario en un entorno más silencioso. Se utiliza un LDV para determinar la señal acústica en la entrada del conducto auditivo midiendo la vibración de la superficie de un pequeño captador de membrana, ligero y retrorreflectante, situado en las proximidades. Aunque la Fig. 1a muestra dos haces láser de entrada, uno para cada oído, se considera y describe aquí una solución de un solo oído en aras de la brevedad y la claridad, pero sin pérdida de generalidad para el equivalente de dos oídos.

Figura 1
figura1

Un auricular ANC virtual. (a) Se forma una zona silenciosa en cada oído utilizando un par de altavoces secundarios cercanos para reducir el sonido en el oído, determinándose la señal de error necesaria a partir de una medición LDV de la vibración de un pequeño captador de membrana situado cerca del canal auditivo. Un sistema de seguimiento basado en una cámara se encarga de controlar activamente los espejos accionados por un galvanómetro para dirigir el rayo láser y mantener su posición en la membrana. (b) La ubicación de los altavoces secundarios. Cada altavoz secundario genera señales antirruido a través del controlador ANC (no se muestra).

Para los sistemas ANC, una zona silenciosa se define como una región en la que se consigue una atenuación del sonido de más de 10 dB, siendo el tamaño de la zona una décima parte de la longitud de onda del sonido en un campo sonoro difuso4. Cuando la membrana se coloca cerca del canal auditivo, se puede crear una zona silenciosa de este tipo a su alrededor, reduciendo así el sonido que se propaga a la membrana timpánica (tímpano). Los dos altavoces secundarios presentados aquí se colocaron a 0,44 m de distancia con un ángulo acimutal de 45 grados apuntando hacia el usuario, como se muestra en la Fig. 1b. El controlador toma la velocidad de vibración de la superficie de la membrana a partir de un LDV como señal de error para el control adaptativo, cuyos detalles se pueden encontrar en la subsección Métodos-algoritmo de control de ruido.

Los movimientos normales de la cabeza se pueden acomodar mediante un sistema de seguimiento relativamente sencillo basado en una cámara, esbozado en la Fig. 1a, que controla activamente un par de espejos ortogonales accionados por galvanómetro para mantener la incidencia del haz láser de la sonda en el centro de la membrana. Mediante la aplicación de un algoritmo de procesamiento de imágenes a medida, el LDV puede obtener a distancia la señal de error acústico en tiempo real.

El montaje experimental se presenta en la Fig. 2a. El experimento se realizó en una sala silenciosa con un nivel de presión sonora de fondo de 38,5 dBA (SPL ponderado A, dB re. 20 μPa). Se utilizó un simulador de cabeza y torso (HATS; Brüel and Kjær Type 4128-C) con simuladores de oído derecho e izquierdo para medir el sonido que se experimentaría en los tímpanos de un usuario. La figura 2b muestra el diseño y la configuración del captador de membrana utilizado en este sistema. El captador consiste en un trozo de película retrorreflectante (3 M-Scotchlite Sheeting 761027), de 0,1 mm de grosor, estirado sobre un tubo cilíndrico polimérico corto y cerrado de 9,2 mm de diámetro, 4,6 mm de profundidad y una masa de aproximadamente 0,2 g. La combinación resultante es, por tanto, lo menos invasiva posible en términos de tamaño y masa. La película se utilizó como membrana para maximizar la señal óptica retrodispersada en relación con el rayo láser entrante, independientemente de una incidencia del rayo no normal, lo que resulta ventajoso en presencia de los inevitables movimientos de la cabeza. La membrana funciona de forma similar al diafragma de un micrófono, convirtiendo la vibración mecánica inducida por la presión acústica en una señal eléctrica. Sin embargo, en este caso, no hay componentes electrónicos en el interior (por ejemplo, un preamplificador para procesar la señal medida), ni la necesidad de cableado para la transmisión de la señal. En su lugar, el acondicionamiento y la conversión de la señal se realizan a distancia en la optoelectrónica del LDV. Se han determinado los parámetros detallados del material retrorreflectante y la respuesta en frecuencia del captador de membrana, que pueden encontrarse en la Fig. S1 suplementaria y en la Tabla S1 suplementaria.

Figura 2
figura2

Estructura experimental para un HATS estacionario. (a) Se colocaron dos altavoces secundarios detrás del HATS para controlar el sonido. Se colocaron varios altavoces primarios (se muestran tres) de forma arbitraria para simular el sonido no deseado procedente de diferentes direcciones. El rayo láser de la sonda del LDV se dirigió hacia la membrana del oído. (b) Se colocó una membrana cerca del canal auditivo de la oreja sintética izquierda del HATS. El LDV determina remotamente la velocidad de la superficie de la membrana como señal de error para el controlador ANC.

El sistema de adquisición de datos está en una ubicación remota junto con el LDV en la disposición propuesta. El LDV (Polytec PDV-100) tiene un rango de frecuencia medible de 20 Hz a 22 kHz. El LDV se montó sobre un trípode, aislado de las vibraciones del HATS y de los altavoces (Genelec 8010A). La frecuencia de muestreo del controlador ANC (Antysound TigerANC WIFI-Q) se fijó en 32 kHz, y las longitudes de los filtros para las rutas primaria y secundaria se fijaron en 1024 tomas. Cabe señalar que el algoritmo de control adaptativo simplemente tomó la señal de velocidad de la membrana medida directamente e intentó minimizarla. Aunque la señal de velocidad podría convertirse en presión sonora por algún medio, esto no era necesario; el resultado sería el mismo si se tratara de la señal bruta o de algún derivado de la misma.

Colocación óptima del captador de membrana

Aunque es obvio que hay que colocar el captador de membrana lo más cerca posible del canal auditivo, no está inmediatamente claro qué ubicación o ubicaciones específicas eran más factibles u óptimas y cuál sería el rendimiento del CNA para cada una de ellas. En la Fig. 3 se ilustran cuatro posibles ubicaciones de captación, donde la ubicación #1 está en la muesca anterior del pabellón auricular, la ubicación #2 está en el tragus, la ubicación #3 está en el cavum concha, y la ubicación #4 está en el lóbulo. Los experimentos se realizaron en el oído sintético izquierdo del HATS. Sólo se utilizó un altavoz, situado a 0,6 m directamente en la parte posterior del HATS, como fuente primaria. La señal de la fuente primaria fue un ruido gris de banda ancha con un filtro de curva de Fletcher-Munson personalizado28 de 500 Hz a 6 kHz (véase la Fig. S2 suplementaria). El filtro se aplicó aquí para obtener un SPL medido con una respuesta de frecuencia plana dentro del HATS. El SPL global en la membrana timpánica izquierda fue de 77,7 dB (re. 20 μPa-omitido en lo sucesivo por brevedad) con el ANC desactivado.

Figura 3
figura3

Los SPL (dB re. 20 μPa) medidos desde el simulador de oído izquierdo de un HATS, simulando el sonido que experimenta un usuario en la membrana timpánica izquierda con y sin ANC, cuando la membrana estaba en (a) la ubicación #1-muesca anterior; (b) la ubicación #2-trago; (c) la ubicación #3-cavum concha; y (d) la ubicación #4-lóbulo del oído sintético izquierdo del HATS.

Con el ANC activado, los rendimientos en las localizaciones #1 y #2 fueron similares, siendo el SPL global resultante de 69,2 dB y 70,9 dB, respectivamente. Sin embargo, la reducción del sonido sólo fue significativa en las frecuencias inferiores a 4 kHz. La razón puede ser que las presiones sonoras medidas en estos dos puntos sólo son similares a las del canal auditivo por debajo de 4 kHz. Por lo tanto, las prestaciones de control en los dos puntos también están limitadas hasta los 4 kHz. La reducción sonora en el punto nº 3 fue la mejor, con un SPL global de 63,5 dB cuando el ANC estaba activado. El SPL global se redujo en 14,2 dB en toda la gama de frecuencias de 500 Hz a 6 kHz. La ubicación nº 4, el lóbulo, estaba más alejada del canal auditivo que cualquiera de las otras ubicaciones seleccionadas. El rango de frecuencias efectivo de la reducción del sonido fue sólo hasta aproximadamente 3 kHz, con un aumento de aproximadamente 6 dB en el hecho observado en el rango de 5 a 6 kHz. Basándose en los resultados de este análisis de rendimiento de la ubicación de la membrana, se identificó la ubicación nº 3 (el cavum concha) como la ubicación óptima para la membrana; en el resto de las investigaciones experimentales descritas en el presente documento, ésta es, por tanto, la posición de la membrana empleada.

Evaluación del rendimiento para el ruido de banda ancha

La figura 4 muestra los espectros de ruido medidos para cada oído sin y con ANC para tres escenarios diferentes de campo sonoro primario. Los altavoces accionados con señales comunes se dispusieron para crear entornos cada vez más complejos con uno o varios reflectores. La señal utilizada fue de nuevo el ruido gris de banda ancha equivalente al utilizado para obtener los resultados presentados en la Fig. 3. Todos los resultados de las pruebas se obtuvieron promediando sobre una longitud de datos de 15 s. La figura 4a muestra la configuración en la que una única fuente primaria se situó a 0,6 m directamente en la parte trasera del HATS para simular el sonido procedente de una fuente cercana sin tener en cuenta las reflexiones del entorno. Tras activar el ANC, se consiguió una atenuación de casi 15 dB, reduciendo el SPL global de 78,1 dB a 63,8 dB y de 77,3 dB a 62,0 dB en los oídos izquierdo y derecho respectivamente. Este escenario es similar al presentado en el actual sistema de última generación20, en el que se controló el sonido hasta 1 kHz, aunque aquí la mejora conseguida es en un rango de frecuencias mucho más amplio, hasta 6 kHz. Cabe destacar que las pruebas se siguieron realizando en cada lado por separado en lugar de tomarse simultáneamente en este caso.

Figura 4
figura4

Tres configuraciones de los altavoces primarios y el correspondiente SPL (dB re. 20 μPa) con y sin ANC en ambos oídos. (a) Se utilizó un único altavoz primario para simular el sonido de una única fuente cercana. (b) Se utilizaron dos altavoces primarios para simular dos fuentes de sonido cercanas o una única fuente de sonido con una superficie reflectante cercana. (c) Se utilizaron cuatro altavoces primarios para simular el sonido procedente de múltiples direcciones, aproximándose a un caso general en la práctica.

La figura 4b muestra la configuración y los resultados de una situación en la que se colocaron dos altavoces primarios de forma arbitraria en dos lugares diferentes. Esto puede representar una situación en la que el usuario está cerca de una gran superficie rígida reflectante, como una mesa o una pared. En este caso, las señales acústicas de la fuente original y del reflector son coherentes. Se obtuvo una atenuación de aproximadamente 13 dB, reduciéndose los NPS globales de 80,2 dB y 77,9 dB a 66,0 dB y 65,2 dB en los oídos izquierdo y derecho, respectivamente. La figura 4c muestra una situación más general en la que existen múltiples reflectores. Para ello, se colocaron arbitrariamente cuatro altavoces primarios en distintos lugares de la cabeza. Se obtuvo una atenuación de aproximadamente 11 dB con una reducción del SPL global de 80,4 dB a 68,9 dB y de 80,1 dB a 69,4 dB en el oído izquierdo y derecho respectivamente. En estos tres escenarios de ejemplo, el sistema demostrado produjo una reducción mínima de 10 dB en toda la gama de frecuencias de 500 Hz a 6 kHz. Cabe señalar que las ubicaciones de estas fuentes primarias se crearon de forma arbitraria, sin embargo, se espera que los rendimientos de control observados sean similares para cualquier otra configuración similar.

Evaluación del rendimiento para el ruido ambiental sintético

Para demostrar aún más la capacidad de la solución propuesta, se evaluó el rendimiento en presencia de tres tipos diferentes de escenarios de ruido ambiental común pregrabado. De forma similar a la configuración implementada recientemente20, la fuente primaria se situó a 1,2 m directamente detrás del HATS, controlándose sólo un canal (el del oído derecho). Los tres experimentos se realizaron en una cámara hemianecoica. En primer lugar, se utilizó una grabación del ruido interior de los aviones29 como señal de fuente primaria. Las señales de 15 segundos observadas por el HATS antes y después del ANC se muestran en la Fig. 5a con los espectros correspondientes promediados durante esta duración. El SPL global se redujo significativamente de 74,7 dB a 59,6 dB, una mejora de más de 15 dB. En segundo lugar, se examinó un ejemplo de ruido de vuelo de un avión30 . La figura 5b muestra la señal en el dominio del tiempo observada por el HATS de dicho ruido no estacionario antes y después del CNA y el espectro (promediado sólo de 3 a 8 s). De nuevo, se observa una reducción significativa en el rango de 500 Hz a 6 kHz. De hecho, donde el ruido era más pronunciado, es decir, de 3 a 8 s, el SPL global se redujo de unos 82,1 dB a 61,6 dB, lo que supone una atenuación del sonido de más de 20 dB. Por último, se utilizó una grabación de una multitud de personas hablando como señal fuente primaria31. La figura 5c muestra las señales de 15 segundos en el dominio del tiempo y en el dominio de la frecuencia antes y después de la CNA. El SPL global se controló de 75,5 a 59,8 dB; se consiguió una reducción de más de 15 dB. La tabla 1 resume el promedio de los SPL globales sin y con control utilizando el sistema propuesto para estos nuevos escenarios, en los que se puede conseguir una reducción de ruido de 15-20 dB hasta 6 kHz utilizando el sistema propuesto. Las grabaciones de audio antes y después del ANC pueden experimentarse a través de la Película Suplementaria 1. Es importante señalar que la solución actual de ANC de detección virtual, con un rendimiento de frecuencia superior de alrededor de 1 kHz, no produciría un rendimiento tan impresionante como el auricular ANC virtual presentado aquí, ya que, como se puede observar en la Fig. 5, el contenido de frecuencia más significativo en las tres señales de ejemplo se encuentra principalmente en el rango de 2 a 4 kHz.

Figura 5
figura5

La señal en el dominio del tiempo observada por los HATS y el correspondiente nivel de presión sonora (dB re. 20 μPa) sin y con ANC para (a) el ruido del interior de un avión, (b) el ruido del sobrevuelo de un avión y (c) el ruido ambiental de personas hablando.

Tabla 1 El SPL global promedio sin y con el sistema ANC propuesto para tres tipos de ruido primario ambiental de ejemplo sintético.

Evaluación del rendimiento en presencia del movimiento de la cabeza

Una persona es propensa a exhibir un movimiento continuo de la cabeza, por lo tanto, el rayo láser de la sonda del LDV debe ser capaz de seguir el correspondiente movimiento arbitrario de la membrana en los oídos. Este tipo de soluciones LDV de seguimiento han sido ampliamente investigadas, desarrolladas y aplicadas para numerosas tareas de medición complejas26; el escenario que nos ocupa representa otra aplicación interesante. Por lo tanto, se implementó un sencillo sistema de seguimiento para demostrar la prueba de concepto. Este sistema de seguimiento basado en una cámara a medida se muestra en la Fig. 6 con las especificaciones presentadas en la subsección Métodos-Sistema de seguimiento de la cabeza. El escenario utilizado aquí es el mismo que el descrito en la Fig. 4a, es decir, el de una única fuente de sonido inmediatamente posterior.

Figura 6
figura6

(a) Configuración del sistema de seguimiento de la cabeza con un único altavoz primario. El sistema de seguimiento y el LDV se colocan al lado izquierdo de la cabeza. (b) La construcción del sistema de seguimiento con un espejo panorámico y uno de inclinación para dirigir el rayo láser. La cámara está conectada al controlador para el seguimiento del objeto. (c) Un marcador amarillo se coloca debajo de la membrana en el lóbulo de la oreja como el objeto de destino. (d) Esquema del sistema de seguimiento basado en la cámara que muestra la trayectoria del haz láser desde el LDV de exploración.

El movimiento de un marcador en el lóbulo de la oreja del HATS, como se ilustra en la Fig. 6c fue determinado por el sistema de seguimiento basado en el procesamiento de imágenes para mantener la incidencia del haz láser casi óptima en la membrana y producir una señal de error útil. La figura suplementaria S3 y los comentarios asociados presentan los efectos de las mediciones descentradas y los diferentes ángulos de incidencia del rayo láser en el rendimiento del sistema. En general, el rendimiento no fue especialmente sensible a la ubicación precisa del rayo láser en la membrana, por lo que se consideró que no era necesario que la incidencia del rayo láser estuviera precisamente en el centro geométrico. Con el rayo láser ligeramente descentrado, se mantiene el rendimiento de la CNA. Además, el ángulo de incidencia del rayo láser no afectó significativamente al rendimiento. Con una incidencia bastante notable de 60 grados, la señal LDV disminuye en unos 5 dB, lo que, de nuevo, tiene un efecto perjudicial mínimo en el rendimiento del CNA. Estas características han sentado las bases para la aplicación con éxito del sistema de seguimiento para gestionar los inevitables movimientos de la cabeza del usuario.

La figura 7 muestra cuatro rendimientos de control: cuando el ANC está desactivado (1) y activado (2) para un HATS estacionario y cuando el ANC está activado con el sistema de seguimiento de la cabeza desactivado (3) y activado (4) para un HATS en movimiento. El movimiento del HATS se implementó manualmente con un movimiento de avance y retroceso utilizado para simular que una persona se mueve hacia adelante y hacia atrás mientras está sentada. La distancia máxima que recorrió el HATS en la Película Suplementaria 2 fue de aproximadamente 0,08 m de pico a pico con una velocidad máxima de unos 0,04 m/s. La Figura 7a muestra la muestra de 15 segundos de la medición en el dominio del tiempo para cada caso con la misma configuración que en la Fig. 4a. La figura 7b muestra el correspondiente espectro de frecuencias promediado para cada caso durante toda la duración. Al igual que los resultados presentados anteriormente en la Fig. 4a, el SPL total se redujo de 81,1 a 64,1 dB en la gama de frecuencias de 500 Hz a 6 kHz para la situación estacionaria.

Figura 7
figura7

Rendimiento de ANC con el sistema de seguimiento de cabeza desarrollado. (a) Cuatro muestras de 15 s de la señal en el dominio del tiempo observada por el HATS. La duración superior de 30 s muestra la presión sonora con el ANC apagado y encendido para la situación estacionaria, mientras que la duración inferior de 30 s muestra la presión sonora con el ANC encendido con el sistema de seguimiento apagado y encendido para un HATS en movimiento. (b) El nivel de presión sonora correspondiente (dB re. 20 μPa) de las cuatro señales.

Cuando el HATS se movía con el ANC activado pero con el seguimiento desactivado, la cabeza (por lo tanto, la membrana) se alejaba del rayo láser de la sonda; la señal LDV, por lo tanto, se «caía» o hacía una medición de la vibración no representativa de la presión sonora en el oído. Esto puede hacer que el sistema de control se desvíe fácilmente y, como se muestra en la Fig. 7b, el SPL global aumentó de hecho significativamente de 81,1 a 99,5 dB. Cuando se activó el sistema de seguimiento, los espejos mantuvieron la incidencia del rayo láser en la membrana mientras el HATS se movía. Así, la medición del LDV siguió siendo válida para el control adaptativo. Como se muestra en la Fig. 7b, el sistema redujo el sonido de 81,1 a 70,4 dB en toda la gama de frecuencias. El rendimiento del control mantuvo al menos una reducción de 10 dB durante el movimiento del HATS, lo que demuestra la necesidad de utilizar un sistema de seguimiento para el sistema ANC. De nuevo, estas grabaciones de audio pueden experimentarse en la Película Suplementaria 2.