daniel maggiolo apuntes de acústica musical

PERCEPCIÓN DE ALTURA


La altura es el atributo que nos permite ordenar sonidos en escalas de más grave a más agudo.

Hay dos teorías que intentan explicar la percepción de altura: la teoría del lugar y la temporal.

La teoría del lugar afirma que el oído interno realiza una especie de análisis espectral, correspondiendo la altura que se percibe al lugar en el cual se produce la mayor excitación de la membrana basilar.

La teoría temporal relaciona la altura percibida con patrones de tipo temporal en el estímulo, en particular su período. La actividad neuronal se realizaría en una relación con dichos patrones temporales.

La teoría del lugar, si bien ha sido bastante comprobada en su funcionamiento hasta ahora, no es del todo comprensible cuando se trata de sonidos complejos, dado que se excitan muchos puntos de la membrana basilar a la vez, y el punto de mayor excitación no tiene por qué corresponder a la frecuencia correspondiente a la altura que se percibe (la frecuencia fundamental de un sonido no tiene por qué ser el parcial con mayor amplitud - ni siquiera tiene que estar presente, como veremos más adelante).


Altura de los sonidos

Esencialmente podemos distinguir tres tipos de sonidos:

  • sonidos simples (senoidales, por tanto periódicos);
  • sonidos complejos periódicos;
  • sonidos complejos no periódicos.

Altura en sonidos senoidales

Existe una relación directamente proporcional entre la frecuencia y la altura de un sonido. A mayor frecuencia, mayor altura. La teoría del lugar explica razonablemente este fenómeno.

Dado que el período T es la inversa de la frecuencia f, también podemos decir que existe una relación inversamente proporcional entre el período T y la altura. La teoría temporal explica también razonablemente este fenómeno.

Altura en sonidos complejos periódicos

Los sonidos complejos periódicos producen una sensación de altura definida.

Los sonidos complejos periódicos son aquéllos cuya serie de parciales es una serie armónica. Una serie de parciales es armónica cuando entre las frecuencias de sus diferentes componentes (sonidos simples, senoidales) existe una relación sencilla de números enteros o, dicho de otra forma, cuando las frecuencias de sus componentes son múltiplos enteros de una frecuencia que es generadora de la serie y llamamos frecuencia fundamental.


FIGURA 00: Componentes de la serie armónica


Si la frecuencia fundamental (nótese que sólo se puede hablar del concepto de frecuencia fundamental en el caso de sonidos complejos periódicos) de un sonido es 100 Hz, las frecuencias de los demás parciales (llamados en este caso "armónicos") serán 200 Hz, 300 Hz, 400 Hz, 500 Hz, 600 Hz, ... y sucesivamente. En el caso que la frecuencia fundamental fuera 200 Hz, las frecuencias de los armónicos serían 400 Hz, 600 Hz, 800 Hz, 1000 Hz, ... y sucesivamente.

Es importante destacar que la frecuencia fundamental es la frecuencia "generadora" de la serie, y no simplemente la más baja que aparece. Por ejemplo, en la siguiente serie 200 Hz, 300 Hz, 400 Hz, 500 Hz, 600 Hz, 700 Hz, ... la frecuencia más grave presente en la serie es 200 Hz, pero la frecuencia fundamental de la serie es 100 Hz.

Esto es tanto más importante, por cuanto la ausencia (física) de la frecuencia fundamental en una serie armónica no cambia la percepción de altura de ese sonido (altura residual).

Es fácil de comprobar que el período T de un sonido complejo periódico es igual al período de su frecuencia fundamental. De ahí que -más allá de las consideraciones que haremos más adelante- a grandes rasgos se pueda decir que la altura de un sonido complejo periódico es igual a la altura de su frecuencia fundamental. Así, cuando nos referimos a, por ejemplo, LA 440 Hz, nos estamos refiriendo a la frecuencia fundamental de ese sonido complejo y periódico.

En el caso de los sonidos simples la teoría del lugar puede explicar la percepción de altura. En el caso de los sonidos complejos periódicos la presencia de varias alturas simultáneamente hace que la teoría del lugar no explique claramente la percepción de altura. Esto es tanto más evidente a la luz de lo afirmado anteriormente, de que la altura de un sonido complejo periódico no cambia si la frecuencia fundamental está o no presente.

La teoría temporal es más adecuada para explicar la percepción de altura en el caso de sonidos complejos periódicos, en tanto el período está relacionado con aspectos temporales del sonido. Nótese que, en rigor, la teoría temporal también explica la percepción de altura en sonidos simples, por cuanto la frecuencia f es la inversa del período T.

Altura en sonidos complejos no periódicos

En general, podemos decir que los sonidos complejos no periódicos producen una sensación de altura no definida. Preferimos hablar de sonidos con altura no definida, que de sonidos sin altura, porque en muchos casos sonidos complejos no periódicos producen diferentes grados de sensación de altura.

Existe un continuo entre uno y otro extremo de indefinición, desde el ruido de banda ancha que tiene una altura totalmente indefinida, al caso -por ejemplo- de las campanas, en las cuales generalmente podemos distinguir dos y hasta tres alturas. (Nótese que no por eso el sonido de las campanas pasa a tener una altura definida.)

Si un sonido no periódico tiene una cantidad suficiente de energía concentrada en una pequeña banda de frecuencias, puede producir una sensación de altura definida. De esa manera, la concentración de energía en varias bandas de frecuencias puede llevar a la distinción de diferentes alturas, como en el caso de las campanas.

En la mayoría de los sonidos complejos no periódicos es posible distinguir alturas relativas. Ello tiene que ver con la concentración de energía en una parte u otra del espectro del sonido y/o del rango de frecuencias audibles.

Un ruido de banda angosta de 100 - 200 Hz sonará más "grave" que otro de banda entre 1900 - 2000 Hz (aunque el ancho de banda sea el mismo).

Un ruido de banda limitada, por ejemplo 200 - 3000 Hz, podrá producir sensaciones de alturas relativas diferentes si, por ejemplo, más del 70% de su energía se concentra en la banda de 300 - 400 Hz (más grave), que si la misma se concentra en la banda de 2.6 - 2.7 kHz (más agudo).

En rigor, la sensación suele ser de más "brillante" o más "opaco", pero en relación con la altura produce las sensaciones de más "agudo" o más "grave".

En una cuerda de tambores (chico, repique, piano), por ejemplo, será posible reconocer las alturas relativas de los tambores, aunque quizás en ninguno de los casos particulares tengamos una percepción de altura definida.


Intervalos musicales


La altura musical tiene al menos dos dimensiones:
· "Altitud" del sonido, que determina en cuál octava se encuentra el sonido
· "Croma" del sonido (o clase de altura), que determina la posición del sonido dentro de la octava

El intervalo musical es la distancia entre dos alturas (obviamente, dos alturas definidas).

El intervalo se mide a partir de la relación entre las frecuencias de los sonidos (las frecuencias fundamentales). El intervalo NO se mide a partir de la distancia en Hz entre dos sonidos. La siguiente tabla muestra las relaciones de frecuencia para distintos intervalos.


FIGURA 01


Altura de sonidos senoidales

En general se puede afirmar que existe una relación entre la frecuencia del sonido senoidal y la altura percibida, de manera tal que a mayor frecuencia aumenta la altura. La teoría del lugar explica razonablemente este fenómeno.

Para obtener una escala de alturas se comenzó estudiando la relación entre la percepción de alturas en sonidos senoidales. Al sujeto se le pedía establecer una frecuencia para la cual la altura era el doble o la mitad de la que producía un sonido de referencia.

Para frecuencias por debajo de 1 kHz puede establecerse claramente que la mitad (o el doble) de altura está establecida por una relación de frecuencias de 2:1, lo que musicalmente se conoce como intervalo de octava.

No obstante, si se le presenta al sujeto un sonido senoidal de 8 kHz y se le pide que establezca la frecuencia para la cual se produce la mitad de la altura, en general el sujeto escogerá una frecuencia de 1.3 kHz, y no una de 4 kHz como hubiera sido de esperar.


FIGURA 02

La figura es de E. Zwicker, H. Fastl: Psychoacoustics. Facts and models


Si bien doblando o estableciendo la mitad de la altura pueden generarse escalas de relaciones de frecuencia, no es posible establecer por este método escalas absolutas de altura. Es necesario establecer un punto de referencia para la sensación "relación de alturas" como función de la frecuencia. Parece conveniente también establecer ese punto en un lugar en que existe una proporcionalidad entre las frecuencias y sus mitades o dobles. También parece conveniente establecer que el factor entre una y otra sea 1, y no 2 como estaba señalado en la figura anterior.

Es así que se ha establecido la frecuencia de referencia de 125 Hz para generar la escala de mel, una escala absoluta de relación de alturas. 125 Hz corresponde a 125 mel, o que quiere decir que un sonido senoidal con una frecuencia de 125 Hz tiene una relación de altura de 125 mel..

Para frecuencias bajas el valor numérico entre los Hz y los mel coincide prácticamente. No así para las frecuencias más agudas.

Obsérvese en la figura 02 que una frecuencia de 8 kHz tiene una relación de alturas de 2100 mel, mientras que una frecuencia de 1.3 kHz tiene una de 1050 mel. Ello refleja lo hallado experimentalmente que un sonido senoidal con frecuencia de 8 kHz produce el doble de altura de uno de 1.3 kHz.

Frecuencias de aproximadamente 16 kHz producen relaciones de altura de unos 2400 mel.


Altura de un sonido senoidal y nivel sonoro

Los experimentos han mostrado que la altura de los sonidos senoidales no depende sólo de la frecuencia, sino también del nivel de presión sonora de los mismos. No obstante, se ha establecido que no existe una relación lineal entre la variación de una y otra, sino que el desplazamiento de altura en función del nivel de presión sonora depende de la frecuencia del sonido senoidal.


FIGURA 03

La figura es de E. Zwicker, H. Fastl: Psychoacoustics. Facts and models


La figura 03 muestra la desviación de altura en función del nivel de presión sonora para sonidos senoidales con cuatro frecuencias distintas: 200 Hz, 1 kHz, 4 kHz y 6 kHz. La referencia es siempre la altura que produce el sonido senoidal con un nivel sonoro de 40 dB.

Puede observarse que para niveles de presión sonora de 80 dB la variación de altura es de aproximadamente el 3%, lo que puede considerarse prácticamente despreciable. No obstante, es relevante si se pretende establecer exactamente cuál es la altura de un sonido.


Altura de un sonido senoidal y enmascaramiento

También se han podido detectar desplazamientos en la altura de sonidos senoidales si existen además otros sonidos que producen un enmascaramiento parcial.

En líneas generales se ha establecido que si los sonidos que producen el enmascaramiento parcial tienen frecuencias inferiores al sonido senoidal de referencia, el desplazamiento de altura es hacia arriba, mientras que si los sonidos que producen el enmascaramiento parcial tienen frecuencias superiores al sonido senoidal de referencia, el desplazamiento de altura es hacia abajo.


Altura de sonidos complejos periódicos

En este caso debe tenerse en cuenta la discriminación hecha anteriormente entre lo que llamamos sonidos complejos con serie armónica y sonidos complejos con serie no armónica.

La altura que se percibe en el caso de los sonidos complejos armónicos podría ser explicada mejor por la teoría temporal. Se ha comprobado que la actividad de las neuronas se sincroniza con los patrones temporales del estímulo, de manera tal que existe un "enganche de fase". Es decir, las neuronas no se disparan necesariamente de manera sincrónica con el período de un sonido complejo, pero sí con algún múltiplo del mismo. (En rigor, las neuronas tampoco se disparan de manera exactamente sincrónica.)

Este enganche de fase no sucede para frecuencias superiores a los 5 kHz, lo que explicaría nuestra pérdida de percepción de altura a partir de dicha frecuencia.

En lo esencial, para sonidos complejos con series armónicas la altura que se produce es prácticamente igual que la que produce un sonido senoidal con una frecuencia igual a la frecuencia fundamental del sonido complejo.

No obstante, si se estudia con más detenimiento, es posible establecer que existe una desviación ente la altura producida por un sonido complejo y un sonido senoidal.


FIGURA 04

La figura es de E. Zwicker, H. Fastl: Psychoacoustics. Facts and models


La figura 04 muestra la diferencia que existe entre la frecuencia de un sonido senoidal y la frecuencia fundamental de un sonido complejo que producen la misma altura. Para una frecuencia fundamental de 400 Hz la diferencia es de aproximadamente 1% (396 Hz en el sonido senoidal), mientras que para una frecuencia fundamental de 60 Hz la diferencia es del 3% (58.2 Hz en el sonido senoidal). Puede observarse también que a partir de 1 kHz las frecuencias coinciden.

Puede afirmarse entonces que sonidos senoidales con frecuencias menores a 1 kHz producen alturas más bajas que sonidos complejos con frecuencias fundamentales iguales.


Altura de un sonido complejo armónico y nivel sonoro

También en los sonidos complejos armónicos la altura depende del nivel de presión sonora.


FIGURA 05

La figura es de E. Zwicker, H. Fastl: Psychoacoustics. Facts and models


La figura 05 muestra la altura que produce un sonido complejo con frecuencia fundamental de 200 Hz en función de su nivel de presión sonora.


Altura residual

Si se retira la frecuencia fundamental de un estímulo sonoro complejo con serie armónica, la altura permanece prácticamente invariable.

Un sonido con componentes senoidales 200, 400, 600, 800, 1000, 1200... Hz produce una altura correspondiente a 200 Hz, es decir, la de su frecuencia fundamental (con las consideraciones hechas anteriormente). Si se filtra la frecuencia fundamental del sonido complejo, dejando la serie 400, 600, 800, 1000, 1200... Hz, la altura percibida seguirá siendo la misma, es decir, la correspondiente a 200 Hz.

Esto ha llevado a la definición de la altura residual (o virtual).


Altura residual de un sonido complejo armónico (incompleto)

No obstante, no todo sonido complejo armónico al cual le falta la frecuencia fundamental produce una altura residual.

FIGURA 06

La figura es de E. Zwicker, H. Fastl: Psychoacoustics. Facts and models


La figura 06 muestra el área en la cual deben aparecer componentes espectrales para producir una altura residual.

Por ejemplo, un sonido complejo armónico con frecuencia fundamental (ausente) de 50 Hz produce una altura residual si la componente más baja presente es menor a 1 kHz. Puede observarse también que un sonido complejo armónico cuya componente más baja sea 5 kHz no producirá nunca una altura residual.

Obsérvese que la figura muestra que no es ni siquiera necesario que esté ausente sólo la frecuencia fundamental para producir una altura residual, sino que puede faltar toda una banda de frecuencias por debajo de cierta componente, que incluye la frecuencia fundamental, para que la altura residual se produzca.

Se ha sugerido que la altura residual siempre será un subarmónico de un parcial predominante en la serie, esto es, un parcial que pueda percibirse claramente en el contexto del sonido complejo. Estos se verá favorecido si los parciales predominantes se encuentran dentro de la banda de frecuencias de 500-1500 Hz.

En el caso de sonidos complejos armónicos el subarmónico en el cual se de la mayor cantidad de coincidencias entre los tres parciales es el que determina la altura percibida. Un sonido con sólo componentes de 1.0 - 1.2 - 1.4 kHz tendrá una altura residual igual a uno complejo con frecuencia fundamental de 200 Hz.

En general, la altura de sonidos complejos armónicos incompletos es análoga a la de los sonidos complejos armónicos completos, de manera que las frecuencias de la frecuencia fundamental (ausente) muestran valores negativos con respecto a la frecuencia de los sonidos senoidales, pero éstas se multiplican por un factor dos con respecto a lo que sucedía en el caso de los sonidos complejos armónicos completos.


Altura residual de un sonido complejo no armónico (incompleto)

Anteriormente hablamos de la altura residual de sonidos complejos armónicos a los cuales le faltaba la frecuencia fundamental o toda una parte (inferior) de su espectro. No obstante, la relación entre las frecuencias de las distintas componentes presentes seguían correspondiendo a la de una serie armónica.

Partiendo del mismo ejemplo mencionado anteriormente, componentes espectrales de 1.0 - 1.2 - 1.4 kHz, podemos desplazar la frecuencia de las mismas 20 Hz a la derecha o 20 Hz a la izquierda, generando un sonido complejo no armónico (incompleto).

En este caso, el subarmónico alrededor del cual se produzca mayor cantidad de coincidencias será el que prediga mejor la altura a percibir.


FIGURA 07


La figura 07 muestra el cálculo de altura residual para un sonido con tres componentes cuyas frecuencias se indican allí.

Parecería ser como que el sistema auditivo central, en alguna etapa de procesamiento, tratara de interpretar la serie de componentes del sonido que recibe como una serie armónica, percibiendo la altura que más se ajuste a la serie armónica posible, de la cual las componentes percibidas pudieran formar parte.


Altura residual y sistema auditivo central

Hay experimentos que han presentado resultados que ni la teoría del lugar ni la temporal de percepción de altura pueden explicar. Ellos apuntarían a la conclusión que, de alguna manera, la altura también es el resultado de un procesamiento a nivel central del sistema auditivo.

Sujetos pudieron percibir alturas residuales en el caso de estímulos enviados diferenciadamente a los dos oídos. Cada oído recibía un sonido senoidal correspondiente a un parcial (distinto y de orden consecutivo) de un sonido complejo. En tal caso ni la teoría del lugar ni la teoría temporal pueden explicar la percepción de altura.

Otros experimentos han mostrado incluso que, bajo circunstancias especiales (un cierto precondicionamiento y la existencia de un ruido de fondo) un sujeto puede percibir una altura residual aún cuando el estímulo contenga un solo parcial de la serie (es decir, sea un sonido senoidal).


Altura de ruidos

Un ruido de banda ancha (por ejemplo, ruido blanco) no produce sensación de altura. No obstante, si limitamos el ancho de banda de un ruido (por ejemplo, blanco), podemos obtener sensaciones de altura de diferente peso.

Si le aplicamos a un ruido un filtro pasagraves o pasagudos con una pendiente de unos 120 dB/octava obtendremos una sensación de altura correspondiente aproximadamente a la frecuencia de corte del filtro. Mientras que los filtros pasagraves producen sensaciones relativamente fuertes de altura para todas las frecuencias, en el caso de los filtros pasagudos la sensación de altura comienza a producirse a partir de aproximadamente una frecuencia de corte de 400 Hz.

Si limitamos la banda de un ruido mediante filtros pasagraves y pasagudos (o un filtro pasabandas con un ancho de banda convenientemente amplio) obtendremos, como era de esperar, dos sensaciones de altura distintas, correspondientes a las frecuencias de corte de los filtros. También se aplica lo observado anteriormente, para frecuencias de corte inferiores a los 400 Hz. Se han realizado experimentos con anchos de banda de 3 kHz y de 600 hasta 200 Hz. En esto últimos casos por momentos y en relación con la frecuencia central, la sensación de altura se desplaza a la frecuencia central del filtro.

Si le aplicamos a un ruido un filtro pasabandas con un ancho de banda suficientemente estrecho (por ejemplo, hasta alrededor de los 30 Hz), la sensación de altura producida corresponde a la frecuencia central del filtro pasabandas.


Pitch strength

Estos diferentes niveles de claridad en la sensación de altura llevaron al desarrollo del concepto de pitch strength.


FIGURA 08

La figura es de E. Zwicker, H. Fastl: Psychoacoustics. Facts and models


FIGURA 09

La figura es de E. Zwicker, H. Fastl: Psychoacoustics. Facts and models


Las figuras 09 muestran la pitch strength que genera cada uno de los 11 sonidos definidos en la primera de ellas.


Sonidos de combinación

Un fenómeno de distorsión de nuestro sistema auditivo. Se trata de alturas que percibimos que corresponden a sonidos no existentes en el estímulo físico.

La presencia de dos sonidos senoidales de frecuencias f1 y f2 produce alturas correspondientes al esquema general f1-K(f2-f1).

En particular son especialmente notorios, aún para niveles no tan altos de los sonidos senoidales, las combinaciones de tipo f1-f2 y 2f1-f2.

Los sonidos de combinación deben tenerse particularmente en cuenta por cuanto pueden resultar en distorsiones relevantes en los resultados de los experimentos.




índice top siguiente



hp@eumus.edu.uy