Cómo medir el efecto del Dynamic Amplification Control™ con la relación señal ruido

Tiempo de lectura: 8 Minutos
27.03.2019

Una evaluación cuantitativa de los algoritmos de los audífonos es un paso crucial para los desarrolladores y los clínicos. Permite una mejor comprensión del efecto de diferentes estrategias de procesamiento de señales en diferentes condiciones, como, por ejemplo, utilizando diferentes señales de prueba y opciones de adaptación. Los resultados se pueden utilizar para preparar pruebas clínicas y seleccionar la mejor solución para nuestros productos. Si bien esta noble intención puede ser aceptada universalmente, surgen desafíos respecto a cómo proceder a realizar la evaluación. Esta publicación explica la teoría detrás de las mediciones de la relación señal/ruido de salida (SNR) y propone un método para evaluar el Dynamic Amplification Control™ (DAC ™) de Bernafon. Los materiales complementarios incluidos en este blog se pueden utilizar para reproducir nuestros resultados y extender esta técnica a sus propios casos de uso.

Dynamic Amplification Control™

Es importante revisar el principio fundamental del DAC™ antes de definir la configuración de la prueba e interpretar los resultados. Bernafon introdujo DAC™ con Zerena como complemento del sistema de compresión ChannelFree™. La compresión define típicamente la amplificación como una función del nivel de presión sonora estimado (SPL- Sound pressure level) sin diferenciar el tipo de señal entrante, ya sea habla o ruido. Esta falta de información es proporcionada por el DAC™ que estima la relación señal/ruido. Esta relación señal/ruido indica si la señal que se amplificará consistirá en más habla o más ruido. El habla se amplificará según lo programado y puede ser verificada con mediciones de oído real (REM - real ear measurement), mientras que la ganancia aplicada a las porciones ruidosas de la señal se reducirá con el DAC ™. En otras palabras, la amplificación tiene una característica cuantitativa (basada en el SPL estimado) y una característica cualitativa (basada en el tipo de señal entrante).

El efecto del DAC™ es medible sólo si hay habla y ruido en la señal de prueba. También es importante que la señal de voz contenga pausas naturales, como por ejemplo relaciones de señal/ruido bajas en la zona, para poder ver cómo el DAC™ adapta la amplificación a variaciones rápidas y amplias de las mismas. El desafío, cuando queremos observar este efecto, es saber cómo el audífono amplifica el habla y el ruido presentados simultáneamente. Esto es posible con la técnica de inversión introducida por Hagerman y Olofsson (2004) que se utiliza para medir la SNR en la salida del audífono.

La salida para la relación señal-ruido del audífono

La salida para la relación señal-ruido del audífono proporciona información valiosa a la hora de preparar una prueba clínica. Nos permite definir qué condición auditiva podría usarse para detectar una diferencia en la tecnología con los usuarios de audífonos. Se ha demostrado que una salida de relación señal-ruido mejorada se asocia con una mejor comprensión del habla (Brons et al., 2014) y un menor esfuerzo de escucha (Sarampalis et al., 2009).

El principio de la técnica de inversión es realizar dos grabaciones sucesivas con las señales seleccionadas que desea separar. Si bien estas señales se presentan simultáneamente, se puede ajustar el nivel de cada una de ellas para cubrir un rango definido de entrada de la señal-ruido. Para nuestro caso de prueba, comenzaremos con una señal de voz y una señal de ruido. Mientras que la primera grabación (A) tiene ambas señales originales, el habla se invierte en la segunda (B). En una fase de post procesamiento, se puede combinar las grabaciones para aislar cada señal de interés. El nivel estimado del habla extraída y el ruido extraído se pueden usar para estimar la salida de la relación señal-ruido del audífono.

figure-1-principle-of-the-inversion-technique
Figura 1: Principio de la técnica de inversión para calcular la relación señal-ruido de dos señales reproducidas simultáneamente.

Configuración experimental

Se grabó el efecto del DAC ™ en nuestro estudio de sonido de Bernafon con una cabeza artificial. La amplificación se estableció para coincidir con los objetivos del Laboratorio Acústico Nacional (NAL NL2) para el audiograma estándar N3 (Bisgaard et al., 2010). El archivo Noah con todas las características de adaptación se proporcionó con los materiales complementarios.

figure-2-recording-setup
Figura 2: Configuración de grabación en nuestro Estudio de Sonido Bernafon con el KEMAR y ambos altavoces usados para el experimento.

La señal de prueba de habla internacional (ISTS, Holube et al., 2010) se seleccionó como señal de habla y se reprodujo desde el altavoz frontal (a 0 °). Esta señal posee una serie de ventajas: es de fácil acceso, se acepta comúnmente como una señal de prueba estándar, proporciona un ruido constante que coincide con el espectro a largo plazo de la señal de voz y presenta características de voz naturales con pausas naturales, lo que permite ver los efectos del DAC.

El ruido se reproduce desde un altavoz ubicado a 30° y su nivel de salida se ajusta para cubrir un rango de relación señal/ruido de -5 hasta +20 dB con pasos de 5 dB. Puede haber algunas diferencias menores entre la relación señal/ruido de referencia medida en campo libre y la relación señal/ruido simple debido al azimut (ángulo de la orientación sobre la superficie de una esfera real o virtual) relativo de ambas señales.

La salida estimada de la relación señal/ruido es un resultado muy significativo, ya que se calcula sobre toda la señal de prueba. Nos da una apreciación cuantitativa de lo que está sucediendo a largo plazo con el habla y el ruido amplificados, pero no refleja cambios locales cualitativos con diferentes estrategias de procesamiento. Por tanto, puede ser interesante comenzar la evaluación visualizando la curva de las señales extraídas.

Visualización de cómo el DAC ™ afecta a la curva de la señal

Las curvas del habla y el ruido extraídas se obtienen con la técnica de inversión. En la Figura 3 se muestra un breve enunciado de las grabaciones asistidas a +15 dB con la relación señal/ruido. La unaided signal, que contiene habla y ruido, se traza como referencia con la línea discontinua de color gris claro.

figure-3-envelopes-extracted-speech-noise
Curvas del habla y ruido extraídos sin (izquierda) y con el (derecha) DAC™. La señal de voz se muestra en el color más oscuro y el ruido en el más claro. La señal simple (con voz y ruido) se muestra en gris.

El ruido extraído, representado con el color más claro, muestra menos variaciones de amplitud en el tiempo cuando se procesa con el DAC ™ que con la compresión convencional dependiente del nivel. Esto no supone un gran problema mientras que la señal del habla predomine sobre el ruido. Pero este efecto es más notorio durante las pausas del habla, donde la compresión convencional aumenta la señal de bajo nivel, esto es porque la señal de bajo nivel es principalmente ruido para una prueba a 15 dB.

Naylor y Johannesson (2009) ya citaron este efecto para cualquier arquitectura de compresión en relaciones de señal/ruido positivas. Puede explicarse por el hecho de que la compresión reduce la "distancia" entre el habla y la señal de ruido. Esta sobre amplificación durante las pausas del habla puede proporcionar demasiada escucha de ruido que puede percibirse como molesta. El DAC™ fue diseñado para mitigar este efecto adaptando la amplificación al tipo de señal entrante. Ahora se puede cuantificar este efecto estimando la salida de la relación señal/ruido de larga duración.

Mejora en la salida de la relación señal/ruido con el DAC™

La salida de la relación señal/ruido se calcula en la señal de larga duración, ya que no hacemos suposiciones sobre la importancia de las diferentes partes de las señales de prueba. La salida compleja de la relación señal/ruido de larga duración se estima para cada condición probada definida por su señal/ruido simple y se presenta, a continuación, en la Figura 4.

figure-4-results-of-measurements
Figura 4: Resultados de las mediciones sin y con el DAC™ con compresión ChannelFree™.

La diferencia entre ambas curvas depende de la señal-/ruido simple, es decir, se pueden observar más beneficios en la señal/ruido de salida con el DAC™ en relaciones de señal/ruido positivas simples. Con una prueba positiva de señal/ruido de 19 dB (a la derecha), la mejora con el DAC ™ es de aproximadamente 2,3 dB.

Esta mejora podría no conducir directamente a un beneficio medible en cuanto a inteligibilidad, ya que el ruido sólo es atenuado mientras que se mantenga la audibilidad del habla. Sin embargo, el ruido es mucho menos molesto cuando es estable y más suave. Lesimple y Tantau (2017) demostraron que el DAC™ mejora el tiempo de respuesta a la par que conserva la inteligibilidad del habla en una prueba de reconocimiento de palabras. Estos hallazgos son especialmente importantes ya que Houben et al. (2013) sugirió que un tiempo de respuesta más rápido durante una prueba de habla podría reflejar un esfuerzo de escucha reducido.

Algunos materiales complementarios antes de comenzar

La carpeta de material complementario contiene todas las grabaciones y el archivo Noah si desea reproducir este experimento. Los scripts para extraer señales, calcular la relación señal/ruido de salida y trazar las cifras se pueden utilizar y modificar para satisfacer sus propias necesidades.

Están escritos en R, que es un software de código abierto gratuito.

A continuación, se ofrecen algunos consejos adicionales si desea realizar sus propias mediciones:

  • Tómese su tiempo para calibrar y ajustar el nivel de las señales, especialmente si los dispositivos están equipados con compresión. Algunos sistemas pueden diseñarse con diferentes umbrales de compresión que crearán diferencias en las grabaciones que son difíciles de interpretar.
  • Algunos sistemas de cancelación de retroalimentación inducen un cambio en la fase de la señal. Este es un problema para la técnica de inversión, ya que este cambio no se puede controlar. Por ello recomendamos desactivar el cancelador de retroalimentación y utilizar un audífono cerrado para evitar problemas de acople. Si el problema persiste, disminuya la ganancia o use masilla alrededor del instrumento.
  • La variación de esta prueba con otro tipo de ruido se puede utilizar para escenarios adicionales. Por lo tanto, la estimación de la relación señal/ruido puede ser un desafío si el ruido y el habla no tienen el mismo espectro de larga duración o si el audífono tiene una amplificación de frecuencia específica. Por lo tanto, se recomienda utilizar señales de prueba con los mismos componentes de frecuencia.

Esta publicación se puede utilizar como una introducción básica sobre cómo medir el efecto de diferentes algoritmos como el DAC™. Debería ayudar a los médicos e investigadores a reproducir estos resultados y extender esta técnica a sus propios casos de prueba, por ejemplo, para evaluar la reducción de ruido o los sistemas de micrófonos direccionales. Creemos que una mejor comprensión de la tecnología de los audífonos solo puede ayudar a los audioprotesistas a mejorar la adaptación y el ajuste fino con el objetivo de aumentar la satisfacción del usuario de audífonos.

Referencias

Bisgaard, N., Vlaming, M. S., & Dahlquist, M. (2010). Audiogramas estándar para el procedimiento de medición IEC 60118-15 Trends in Amplification, 14(2), 113-20.

Brons, I., Houben, R., & Dreschler, W. A. (2014). Efectos de la reducción de ruido en la inteligibilidad del habla, el esfuerzo auditivo percibido y la preferencia personal en oyentes con problemas de audición. Trends in Hearing, 18, 233121651455392.

Hagerman, B., & Olofsson, A. (2004). Un método para medir el efecto de los algoritmos de reducción de ruido usando voz y ruido simultáneos. Acta Acustica United with Acustica, 90(2), 356–361.

Holube, I., Fredelake, S., Vlaming, M., & Kollmeier, B. (2010). Desarrollo y análisis de una señal de prueba del habla internacional (ISTS). Revista Internacional de Audiología, 49(12), 891–903.

Houben, R., van Doorn-Bierman, M., & Dreschler, W. A. (2013). Usar el tiempo de respuesta al habla como medida del esfuerzo de escucha. Revista Internacional de Audiología, 52(11), 753–761.

Lesimple, C., & Tantau, J. (2017). Beneficios del control de amplificación dinámica en entornos de escucha complejos. [Papel blanco]. Recuperado en marzo de 2019, de www.bernafon.com/professionals.

Sarampalis, A., Kalluri, S., Edwards, B., & Hafter, E. (2009). Medidas objetivas del esfuerzo de escucha: efectos del ruido de fondo y la reducción del ruido. Revista de investigación del habla, el lenguaje y la audición, 52(5), 1230–1240.

 

About the author:

Christophe Lesimple
Christophe Lesimple
Christophe es un audiólogo de investigación clínica y ha trabajado para Bernafon desde 2011. Contribuye a varios aspectos del desarrollo, como trabajar en conceptos, realizar ensayos clínicos y analizar datos. Además de sus actividades con Bernafon, enseña métodos de investigación y estadísticas en la Universidad de Lyon. En su tiempo libre, a Christophe le gusta tocar música y ser voluntario para una asociación de personas con problemas de audición.

 

Comments