daniel maggiolo apuntes de acústica musical

LOCALIZACIÓN


La localización define la capacidad del individuo de determinar la ubicación de una fuente sonora en el espacio.

La localización sólo es posible a partir de la audición biaural. Con un solo oído no es posible localizar fuentes sonoras.

El sistema auditivo utiliza un conjunto de pistas para determinar la ubicación de la fuente sonora en el espacio.

Por lo general se establecen tres planos característicos en los experimentos destinados a estudiar la localización por parte del ser humano.


FIGURA 01

La figura es de B.J.C. Moore: An Introduction to the Psychology of hearing


La localización se realiza a partir de la determinación de una dirección y una distancia.


Dirección

La dirección de una fuente sonora, a su vez, se establece a partir de la determinación de un ángulo lateral y de un ángulo de elevación.


Lateralización

Para la ubicación lateral de una fuente sonora el sistema auditivo utiliza pistas provenientes principalmente de las diferencias de intensidad y tiempo con que las ondas sonoras llegan a cada uno de nuestros oídos.

Unas y otras son más efectivas para distintos rangos de frecuencia.


Diferencias interaurales de intensidad (DII)

Las DII se dan principalmente a partir de las diferentes distancias que deben recorrer las ondas para llegar a uno y otro oído, pero también por la sombra acústica producida por la cabeza del individuo (difracción de la onda).

Los sonidos de bajas frecuencias tienen longitudes de onda relativamente grandes con respecto a las dimensiones de la cabeza. El estudio de la difracción determina que cuando la longitud de la onda es suficientemente grande con respecto al obstáculo que encuentra la onda, ésta se difracta fácilmente y no se genera una "sombra acústica" (o, al menos, se produce una sombra acústica pequeña). Por el contrario, cuando las longitudes de onda son pequeñas, se produce poca difracción y por lo tanto existe una sombra acústica mayor.

Para frecuencias de 500 Hz la longitud de onda del sonido es de unos 69 cm, unas tres veces el diámetro promedio de una cabeza humana. La difracción es poca. Para frecuencias de 4 kHz (longitud de onda del orden de los 8.5 cm) la sombra acústica es importante.

Las DII son prácticamente despreciables para frecuencias inferiores a los 500 Hz, pero pueden ser de hasta 20 dB para frecuencias mayores de 5 kHz.


FIGURA 02

La figura es de B.J.C. Moore: An Introduction to the Psychology of hearing


Diferencias interaurales de tiempo (DIT)

Las DIT pueden calcularse a partir de las diferencias en las distancias que deben recorrer las ondas.


FIGURA 03A

La figura es de B.J.C. Moore: An Introduction to the Psychology of hearing


FIGURA 03b


Las DIT van de 0 s para fuentes sonoras con un ángulo de 0º (exactamente delante del sujeto), hasta cerca de 0.69 ms para fuentes sonoras con un ángulo de 90º.


FIGURA 04

La figura es de B.J.C. Moore: An Introduction to the Psychology of hearing

Para sonidos senoidales las diferencias de tiempo son equivalentes a diferencias de fase entre las ondas que arriban a cada uno de los dos oídos.



Para sonidos senoidales de bajas frecuencias las diferencias de fase pueden brindar pistas efectivas para la localización lateral de las fuentes sonoras. Pero para sonidos senoidales con longitudes de onda comparables o menores al diámetro promedio de la cabeza (entre 19 y 23 cm según diferentes autores, promediemos entonces en 21 cm), las diferencias de fase suministran pistas ambiguas. Estas frecuencias rondan los 1.6 kHz.

Las diferencias de fase pueden ser tales que haya ciclos enteros de diferencia entre uno y otro oído, y nuestro sistema auditivo no tiene forma de determinar cuál ciclo corresponde a cuál en uno y otro oído.

La ambigüedad comienza a ocurrir a partir de frecuencias cuya mitad de longitud de onda sea la dimensión del diámetro de la cabeza (21 cm), es decir para ondas de aproximadamente unos 800 Hz (longitud de onda = 43 cm).

Un sonido senoidal con esa frecuencia exacta (800 Hz) -o múltiplos enteros de ella- produce una sensación ambigua, dado que las ondas en ambos oídos tienen una diferencia de fase de 180º, por lo que el sistema auditivo no puede establecer si uno está adelantado o atrasado medio ciclo con respecto al otro. Pequeños movimientos de la cabeza pueden ayudar a determinar la localización de la fuente sonora.

No obstante las DIT se vuelven totalmente ambiguas para sonidos senoidales con frecuencias superiores a los 1.5 kHz.


Teoría duplex

El hecho de que las pistas de localización estén dadas por las DII para frecuencias altas y por las DIT para las frecuencias bajas fue denominada "teoría duplex" por Lord Rayleigh en 1907.

No obstante, si bien esta teoría es correcta para ondas senoidales no explica claramente lo que sucede en el caso de sonidos complejos.


Sumario

Las DII (diferencias interaurales de intensidad) existen sólo para frecuencias > 500 Hz y son confiables para f > 3 kHz.

Las DIT (diferencias interaurales de tiempo) son eficaces para f < 1.5 kHz.

Efectivamente, para frecuencias alrededor de 2 kHz existe una zona en la cual la localización es bastante mala.


Umbrales de DIT y DII

El umbral diferencial en la sensación de dirección es de aproximadamente 5º para sonidos ubicados en el plano frontal, lo que corresponde a una DIT de aproximadamente 50 ms. Esto puede considerarse el umbral diferencial para sonidos senoidales con frecuencias inferiores a los 1.5 kHz. No obstante, se han medido umbrales de entre 30 ms y casi 200 ms, lo que muestra una amplia variación individual en los resultados.

DII de entre 1 y 2 dB producen las mínimas variaciones perceptibles en el desplazamiento de las fuentes sonoras. Otros experimentos han determinado que dicho umbral es de 0.5 dB.


Lateralización extrema


FIGURA 05

La figura es de E. Zwicker, H. Fastl: Psychoacoustics. Facts and models


La figura muestra la dependencia de lateralización de las DII. En este caso se usaron sonidos senoidales de 1 kHz y las intensidades de ambos eran tales que el nivel de presión sonora total era de 80 dB.

Una DII de 30 dB entre un sonido y otro produce un desplazamiento total hacia uno de los extremos.

Por su parte, DIT de 1 ms producen también un desplazamiento total hacia uno de los extremos.


Localización de sonidos complejos

Los sonidos que ocurren en situaciones reales tienen fases de ataque y caída, transitorios y características espectrales particulares. La mayoría también cambia su intensidad y su característica espectral en el tiempo.

Las DIT ya no producen la ambigüedad de los sonidos senoidales, dado que el sistema auditivo compara las DIT (diferencias de fase) entre los distintos filtros auditivos. La DIT común entre los diferentes canales es aceptada como la DIT "correcta".

Experimentos realizados utilizaron tres tipos de sonido:

  • ruido de banda limitada, con frecuencias en el rango de 150-1700 Hz;
  • sonidos senoidales de 1 kHz con ataques y caídas graduales;
  • "clicks" de 1 ms de duración.

Los umbrales de DIT determinados fueron 9 ms, 11 ms y 28 ms respectivamente. Una DIT de 10 ms corresponde a un desplazamiento lateral de 1º.

Los datos más exactos fueron brindados por el ruido, lo que se explicaría en el hecho de que un ruido fluctúa aleatoriamente en el tiempo, ofreciendo información acerca de los transitorios repetidamente a lo largo de la presentación de sonido de referencia.

El "click", por el contrario, es en realidad solamente un transitorio, y brindó los resultados más inexactos.

Es de hacer notar que en estos experimentos los sonidos eran en realidad relativamente largos, de aproximadamente 1.4 s de duración. Para sonidos más cortos la exactitud disminuye.

Pero también, para trenes de "clicks" el umbral de DIT puede disminuir hasta los 10 ms, si la frecuencia del tren es razonablemente baja (unos 200 Hz -clicks por segundo- o menos).

Para sonidos con fases de ataque no impulsivas el umbral de DIT mejora a medida que aumenta la duración del sonido, llegando a ser de 6 ms para duraciones de 700 ms.

Cuando se usan señales de banda limitada suele ocurrir un fenómeno denominado inversión. En esos casos, aunque la fuente sonora está situada delante del sujeto, éste la percibe como ubicada detrás de él. Esto se da en casos extremos como confundir 0º con 180º, pero también puede darse para pasos intermedios. Una fuente sonora situada en un ángulo lateral de 20º puede percibirse como situada a 160º.


Localización en el plano medio

Experimentos han mostrado la importancia de la cabeza, pero también del pabellón auditivo en la localización de sonidos que se encuentran en el plano medio. En tal caso las DII y las DIT son cero, dado que ambas ondas sonoras llegan al mismo tiempo y con la misma intensidad a los dos oídos.

El registro de los sonidos para estos experimentos se realizó por medio de micrófonos colocados dentro de pabellones artificiales. No sólo la localización fue correcta por parte de los sujetos, sino que además las imágenes sonoras se conformaron fuera de la cabeza (externalización), a pesar de que los sonidos estaban siendo reproducidos por medio de auriculares.

Cuando se retiraron los pabellones artificiales la discriminación de localización disminuyó significativamente y los sonidos volvieron a percibirse en el interior de la cabeza.

Tanto la cabeza, pero principalmente el pabellón auditivo, modifican el espectro de los sonidos en dependencia del ángulo de incidencia del sonido con respecto a la cabeza. Las diferencias espectrales entre el sonido original y el sonido medido junto al tímpano dieron lugar a las HRTF (Head-Related Transfer Functions) o funciones de transferencia relativas a la cabeza.

Las modificacions espectrales producidas por el pabellón y la cabeza también son usadas por nuestro sistema auditivo para determinar la localización de una fuente sonora. En este caso, es importante que el sonido tenga energía espectral a lo largo de un amplio rango de frecuencias. Las frecuencias superiores a los 6 kHz son particularmente importantes, dado que es en esa región en la que las longitudes de onda se hacen suficientemente pequeñas como para interactuar eficazmente con el pabellón.

Los distintos picos de resonancia en las HRTF corresponden a diferentes localizaciones de las fuentes sonoras en el plano medio.


FIGURA 06

La figura es de E. Zwicker, H. Fastl: Psychoacoustics. Facts and models


Si se presenta un sonido de banda limitada con frecuencias centrales de 300 Hz o 3 kHz la imagen sonora siempre se formará delante del sujeto. Si la frecuencia central es de 8 kHz la imagen estará siempre arriba. Y si la frecuencia central es de 1 o 10 kHz la imagen se formará siempre detrás.


FIGURA 07

En donde:
V = adelante
O = arriba
H = atrás


Efecto de precedencia

En situaciones normales nuestra audición se produce en espacios sonoros difusos, en los cuales los sonidos llegan a nuestros dos oído de todas partes y con distintos retardoss.

Si dos sonidos (cortos) llegan nuestros oídos con una diferencia de tiempo muy corta, los sonidos son percibidos como un solo sonido. El tiempo de retardo varía según las características del sonido mismo, pero pueden encontrarse en el rango de entre 5 ms (para sonidos de tipo impulsos) y 40 ms (para sonidos más complejos, como los encontramos en la música o el habla).

Si dos sonidos (cortos) se fusionan en un solo sonido, la localización del sonido depende mayormente de la localización del primero que llegue a nuestros oídos. Esto ha recibido los nombres de "efecto de precedencia", "efecto Haas", o "ley del primer frente de onda" (Blauert).

El sonido retardado influye en el resultado total de la localización. Si la ubicación del sonido retardado se diferencia mucho de la del sonido que llega primero a nuestros oídos, provoca un desplazamiento en la localización del sonido de hasta 7º, a partir de lo cual se hace cada vez menos efectivo.

También si el sonido retardado es suficientemente más intenso que el primero (10 - 15 dB) se cancela el efecto de precedencia.

El efecto de precedencia sólo se produce en sonidos con carácter transitorio y disminuye si el retardo entre los dos sonido es igual o menor que 1 ms.

El efecto de precedencia se produce también aún cuando el primer y segundo sonido tengan marcadas diferencias espectrales, siempre que la envolvente temporal sea similar.

Los experimentos han llevado a sugerir que el efecto de precedencia tiene su explicación en procesos cognitivos que se desarrollan en niveles relativamente altos.


Importancia de los transitorios

Los transitorios son una de las componentes de los sonidos percibidos usualmente. Las pistas que brindan los transitorios parecerían ser preponderantes en la determinación de la dirección de una fuente sonora, con respecto a las que brindan las fases casi estacionarias de los sonidos (o sonidos estacionarios).

El efecto Franssen es en realidad un caso particular del mencionado efecto de precedencia y permite demostrar la influencia de los transitorios en la determinación de la dirección de una fuente sonora.


FIGURA 08


El efecto Franssen se obtiene a partir de la alimentación de un canal (el izquierdo, en este caso) con un transitorio que desaparece en un tiempo t0 (menor o igual que 30 ms) y otro (el derecho, en este caso) con un sonido que alcanza una fase estacionaria al cabo de t0. A partir del momento t0 sólo emite señal el canal con el sonido estacionario (canal derecho). No obstante, el sujeto percibe el sonido como proveniente del canal que emitió el sonido transitorio (es decir, canal izquierdo).

El retardo entre el sonido directo y las primeras reflexiones sería relevante en la percepción, dado que el efecto Franssen no se produce en condiciones de audición anecoicas (es decir, en situaciones en las que el único sonido percibido es el sonido directo y no existe campo sonoro difuso).


Distancia
  • Intensidad del sonido
  • Situación espectral del sonido (absorción del aire)
  • Relación entre sonido directo y sonido difuso

FIGURA 09




índice top siguiente