Escuela Universitaria de Música
Departamento de Teoría y Composición
Teoría Musical
Prof. Luis Jure

La percepción de los sonidos musicales


Apuntes de "The Perception of Musical Tones" de R. A. Rasch y R. Plomp (1982)
Publicado en: "The Psychology of Music", Diana Deutsch, editora. Academic Press, 1982
Traducción de Martín García


Atributos perceptivos de sonidos aislados

Altura

La altura es la propiedad más característica de los sonidos, tanto simples (sinusoidales) como complejos. Los sistemas de alturas se encuentran entre los más elaborados e intrincados jamás desarrollados tanto en la cultura occidental como no occidental. La altura tiene relación con la frecuencia de un sonido simple y con la frecuencia fundamental de un sonido complejo. La frecuencia de un sonido es una propiedad cuya producción puede a menudo controlarse, y se mantiene durante su propagación hacia los oídos del oyente.

En lo que nos respecta, la altura puede describirse como un atributo unidimensional, es decir que todos los sonidos pueden ser ordenados a lo largo de una sola escala con respecto a la altura. Los extremos de esta escala son grave (sonidos con frecuencia baja) y agudo (sonidos con frecuencia alta). A veces, puede dificultarse la tarea de comparar la altura de dos sonidos distintos por factores tales como la diferencia tímbrica entre ellos o el componente de ruido en cada uno. Hay varias escalas subjetivas de altura:

  1. La escala mel. Un sonido simple de 1000 Hz tiene una altura definida de 1000 mels. La altura en mels de otros sonidos con otra frecuencia debe ser determinada por experimentos de escalado comparativo. Un sonido con una altura que dobla subjetivamente a la de 1000 Hz, es de 2000 mels; "altura media" son 500 mels, etc. Ya que el significado subjetivo de "altura el doble de aguda" o "altura el doble de grave" es invariablemente ambiguo, la escala mel es poco confiable. No es frecuentemente utilizada.
  2. La escala de altura musical (C 1, C4, es decir Do 1, Do 4, etc.). Estas indicaciones son utilizables tan solo en situaciones musicales.
  3. La escala de frecuencia física en Hz. En literatura sicoacústica la altura de un sonido es a menudo indicado por su frecuencia o, en el caso de sonidos complejos, por su frecuencia fundamental. Dado el tipo de correspondencia entre frecuencia y altura, la frecuencia es una indicación aproximada de nuestra percepción de altura. Debe notarse, sin embargo, que nuestra percepción opera más o menos de acuerdo a una escala de frecuencia logarítmica.

La altura en su sentido musical tiene un rango de alrededor de 20 a 5000 Hz, más o menos el rango de las fundamentales de las cuerdas de un piano o los tubos de un órgano. Sonidos con frecuencias más altas son audibles pero sin una sensación definida de altura. Sonidos bajos en el rango de los 10 a 50 Hz pueden describirse como pulsaciones (rattling sound). La transición de la percepción de las pulsaciones a una verdadera sensación de altura, es gradual. La altura puede ser percibida luego de que algunos períodos de la onda sonora fueron expuestos al oído.

Los sonidos simples tienen alturas definidas que pueden ser indicadas por medio de su frecuencia. Estas frecuencias pueden servir como frecuencias de referencia para las alturas de sonidos complejos. La sensación de altura en el caso de sonidos complejos es más difícil de entender que en el caso de los sonidos simples. Los primeros cinco a siete armónicos de un sonido complejo pueden ser distinguidos individualmente si la atención del oyente es alertada sobre su posible presencia. De todos modos, en la práctica musical, el sonido complejo es caracterizado por una sola altura, la altura del primer parcial. En adelante, llamaremos a esta altura "altura grave". Algunos experimentos han demostrado que la altura de un sonido complejo con una frecuencia fundamental f es algo más grave que la de una onda sinusoidal (sonido simple) con la misma frecuencia. La existencia de la altura grave de un sonido complejo genera dos preguntas: 1) ¿por qué el total de parciales de un sonido complejo es percibido como una sola altura? 2) ¿por qué dicha altura es la propia de la frecuencia fundamental (primer parcial)?

La primera pregunta puede ser contestada haciendo referencia a la teoría de la Gestalt; una explicación basada en dicha teoría puede ser formulada de la siguiente manera. Los varios parciales de un sonido complejo son siempre presentados simultáneamente. Nos familiarizamos con los sonidos complejos de las señales del habla a una muy temprana edad (tanto de nuestra propia habla como de la de los demás). No sería eficiente percibirlos separadamente. Todos los componentes indican una misma fuente y significado, de forma que percibirlos como unidad da una idea más simple del entorno que la percepción por separado. Esta forma de percepción debe ser vista como un proceso de aprendizaje perceptivo. La sicología de la Gestalt ha formulado varias leyes que describen la percepción de estímulos sensoriales complejos. La percepción de la altura grave de los sonidos complejos puede ser clasificado dentro de la categoría de la "ley del destino común". Los armónicos de un sonido complejo presentan "destino común".

La segunda pregunta también puede ser contestada con la ayuda de un proceso de aprendizaje dirigido hacia la eficiencia perceptiva. La periodicidad de un sonido complejo es la característica más constante en su composición. Las amplitudes de los parciales son objeto de variación causada por la reflexión selectiva, absorción, el pasaje a través de objetos, etc. El enmascaramiento también puede oscurecer ciertos parciales. La periodicidad, sin embargo, es un factor muy estable y constante de los sonidos complejos. La periodicidad de un sonido complejo es, a la vez, la periodicidad del primer parcial del sonido. La percepción de sonidos complejos puede ser vista como un proceso de reconocimiento de modelos. La presencia de una serie completa de armónicos no es una condición necesaria para el éxito del proceso de reconocimiento de la altura. Es suficiente que al menos un par de armónicos adyacentes estén presentes para que pueda determinarse la periodicidad. Es concebible la existencia de un proceso de aprendizaje perceptivo que haga posible el reconocimiento de la periodicidad fundamental a partir de un número limitado de parciales armónicos. Las teorías de reconocimiento de modelos y su aplicación a la percepción de la altura grave son relativamente recientes. Posiblemente tome algún tiempo antes de que las preguntas sobre la altura grave de los sonidos complejos sean contestadas.

La literatura clásica sobre la percepción del sonido abunda en teorías basadas en la idea de von Helmholtz (1863) de que la altura grave de un sonido complejo está basado en la fuerza relativa del armónico fundamental. Los armónicos más altos se supone que simplemente influyen sobre el timbre de los sonidos, careciendo de suficiente fuerza como para afectar la altura. Sin embargo, la percepción de la altura grave también ocurre cuando el primer armónico no está presente en el estímulo sonoro. Esto ya había sido observado por Seebeck (1841) y puesto ante la atención de los sicoacústicos modernos por Schouten (1938). Estas observaciones llevaron a Schouten a formular la teoría de la periodicidad de la altura. En esta teoría, la altura deriva de la periodicidad en forma de onda de los armónicos más altos del estímulo, el residuo. Esta periodicidad no cambia si se quita un armónico. Con esta teoría las observaciones de Seebeck y Schouten sobre los sonidos sin armónicos fundamentales podían ser explicadas.

En la práctica, los sonidos complejos con fundamentales débiles o ausentes son muy comunes. Más aun, los sonidos musicales son a menudo parcialmente enmascarados por otros sonidos. Estos sonidos pueden, sin embargo, poseer alturas graves muy claras. Los estímulos sonoros musicales efectivos resultan a menudo incompletos cuando se comparan al sonido producido por la fuente (instrumento, voz).

Experimentos sobre la percepción sonora han apuntado a una región de domino para la percepción sonora, básicamente de 500 a 2000 Hz. Los parciales dentro de la región de dominio son los más influyentes con respecto a la altura. Una forma de demostrar esto es trabajar con sonidos con parciales inarmónicos. Supongamos que tenemos un sonido con parciales de 204, 408, 612, 800, 1000 y 1200 Hz. Los primeros tres parciales de forma aislada darían una altura de "204 Hz". Los seis juntos dan una altura de "200 Hz" debido al peso relativo de los parciales más altos, los que se encuentran en la región de dominio. La altura grave de los sonidos complejos con frecuencias fundamentales graves (menos de 500 Hz) depende de los parciales más altos. La altura grave de los sonidos con frecuencias fundamentales agudas es determinada por la fundamental, porque se encuentra en la región de dominio.

Sonidos con parciales inarmónicos se han usado con frecuencia en la investigación de la percepción sonora. Una aproximación de la altura evocada por ellos es la fundamental de la serie armónica más cercana. Supongamos que tenemos un sonido con parciales de 850, 1050, 1250, 1450, 1650 Hz. La serie armónica más cercana es 833, 1042, 1250, 1458 y 1667 Hz, la cual contiene los armónicos 4, 5, 6, 7 y 8 de un sonido complejo cuya fundamental es 208,3 Hz. Esta fundamental puede ser usada como una aproximación de la sensación de altura del complejo inarmónico (fig. 4). Consideremos un sonido inarmónico con parciales de 900, 1100, 1300, 1500, 1700 Hz. Este sonido tiene una altura ambigua, ya que son posibles dos aproximaciones de series armónicas: una con fundamental de 216,6 Hz (el parcial de 1300 Hz es el armónico 6 en este caso) y otra con fundamental de 185,9 Hz (1300 Hz es el armónico 7).

figura 4

figura 4

Si no todos los parciales de un sonido complejo son necesarios para percibir la altura grave: ¿qué cantidad es suficiente? La siguiente serie de investigaciones experimentales muestran un número progresivamente decreciente (fig. 5). De Boer (1956) trabajó con cinco armónicos en la serie de dominio; Schouten, Ritsma y Cardozo (1962) con tres; Smoorenburg (1970) con dos; Houtsma y Goldstein (1972) con uno más uno, es decir, un parcial para cada oído. A través de este último experimento, los autores concluyeron que la altura grave es un proceso del sistema nervioso central, no ocasionado por el órgano sensitivo periférico (los oídos). El último paso en la serie de experimentos sería la altura grave evocada por un parcial. La posibilidad de esto último también fue demostrada por Houtgast (1976); para esto es necesario cumplir con ciertas condiciones: rellenar con ruido la región de frecuencia de la altura grave, una relación señal-ruido bajo, y debe dirigirse la atención del oyente hacia la región de la región de frecuencia de la fundamental mediante estímulos previos. Estas condiciones crean una situación perceptiva en la cual no es cierto que la fundamental no está allí, de forma tal que somos llevados a la idea de que debería estar por deducciones fomentadas por los estímulos anteriores.

figura 5

figura 5

Atributos perceptivos de sonidos simultáneos

A. Batimientos y aspereza

A continuación se tratarán los fenómenos perceptivos que ocurren como resultado de dos sonidos simultáneos; los sonidos que suenan simultáneamente los llamaremos sonidos primarios.

figura 7

figura 7

Consideraremos primero el caso de dos sonidos simples simultáneos. Pueden distinguirse varias condiciones dependiendo de la diferencia de frecuencia (fig. 7). Si los sonidos primarios tienen frecuencias iguales, éstos se fusionan en un sonido, cuya intensidad depende de la relación de fase entre los dos sonidos primarios. Si los dos sonidos primarios difieren en sus frecuencias, el resultado es una señal con amplitud periódica y variaciones de frecuencia, con una frecuencia igual a la diferencia de frecuencia. Las variaciones de amplitud pueden ser considerables y resultar en una intensidad fluctuante y sonoridad percibida. Estas fluctuaciones de sonoridad son llamadas batimientos, si pueden ser percibidos por el oído, lo cual ocurre si su frecuencia es menor a 20 Hz. Un estímulo igual a la suma de dos sonidos simples con amplitudes iguales y frecuencias f y g:

p(t) = sen 2πft

puede ser descripta como:

p(t) = 2 cos 2π 1/2 (g - f)t  X  2 cos 2π 1/2 (g + f)t

Esta es una señal con una frecuencia que es el promedio de frecuencias primarias originales, y una amplitud que fluctúa lentamente con una frecuencia de batimiento de g - f Hz (fig. 8). La variación de amplitud es menor si los dos sonidos primarios tienen amplitudes diferentes.

figura 8

figura 8

Cuando la diferencia de frecuencia es mayor de 20 Hz, el oído ya no es capaz de seguir las rápidas fluctuaciones individualmente. En lugar de la sensación de sonoridad fluctuante, hay una especie de pulsación llamada aspereza.

En la práctica musical, los batimientos pueden ocurrir cuando hay armónicos que no coinciden al tener intervalos consonantes desafinados. Si las frecuencias fundamentales de los sonidos de una octava o quinta difieren en algo de la relación teórica (1:2, 2:3), habrá armónicos que difieren algo en su frecuencia lo cual causará batimientos. Estos batimientos juegan un rol muy importante en el proceso de afinación de los instrumentos.

No se han hecho investigaciones sicoacústicas sobre intervalos desafinados de sonidos complejos, pero en gran medida las observaciones hechas con respecto a los sonidos simples, se aplican para los complejos.

B. Sonidos diferenciales

Dos sonidos simples a un nivel de presión sonora relativamente alta y con una diferencia de frecuencia no demasiado amplia puede dar lugar a la percepción de los llamados sonidos diferenciales. Estos sonidos aparecen en el oído como un producto de características de transmisión no lineal. Los diferenciales no están presentes en la señal sonora, sin embargo son percibidos como si lo estuvieran; el oído no puede distinguir entre sonidos "reales" (presentes en el estímulo) y aquellos que no lo son (diferenciales). Los diferenciales son sonidos simples que pueden ser anulados sumando un sonido simple "real" con la misma frecuencia y amplitud pero con fase opuesta.

Investigaciones sicoacústicas sobre sonidos diferenciales han mostrado que las alturas de los diferenciales coinciden con las frecuencias predichas por transmisión no lineal. Sin embargo, la correspondencia entre la amplitud relativa predicha y la sonoridad subjetiva medida no es nada perfecta. El fenómeno de los diferenciales es más complicado de lo que puede describirse con una simple fórmula.

A pesar de que los diferenciales fueron descubiertos por músicos en un contexto musical (Tartini y Sorge en el siglo XVIII), su significación musical no es muy alta. Pueden ser fácilmente evocados tocando sonidos fuertes en el registro alto en dos flautas o dobles cuerdas en el violín. En una situación auditiva normal, su sonoridad es demasiado débil como para llamar la atención, y en muchos casos aparecen enmascarados por los sonidos de los instrumentos más graves. Algunos maestros de violín (siguiendo a Tartini) los utilizaban como herramienta de control de afinación de intervalos de dobles cuerdas.

C. Consonancia y disonancia

El sonido simultáneo de varios sonidos puede resultar agradable o desagradable. El sonido agradable se llama consonante y el desagradable o áspero, disonante. Los términos consonancia y disonancia fueron usados en sentido perceptivo o sensorial; este aspecto ha sido llamado consonancia tonal o consonancia sensorial, lo cual debe distinguirse del concepto de consonancia en una situación musical.

La consonancia perceptiva de un intervalo consistente de dos sonidos simples depende directamente de la diferencia de frecuencia entre los sonidos, no de la relación de frecuencia (o intervalo musical). Si la separación de frecuencia es muy pequeña o grande (más que el ancho de banda, sin que los sonidos interfieran unos con otros), ambos sonidos juntos suenan consonantes. La disonancia ocurre si la separación de frecuencia es menor que un ancho de banda (fig. 10).

figura 10

figura 10

El intervalo más disonante ocurre con una separación de frecuencia de alrededor de un cuarto del ancho de banda crítica: alrededor de 20 Hz en secciones de frecuencia grave, alrededor de 4% (algo menos de un semitono) en las regiones más agudas (fig. 11). La separación de frecuencia de la tercera menor (20%), tercera mayor (25%), cuarta (33%), quinta (50%), etc., es generalmente suficiente para dar una combinación consonante de sonidos simples. Sin embargo, si las frecuencias son graves, la separación de frecuencias de terceras (y eventualmente también quintas) es menor al ancho de banda crítico, de forma tal que aun estos intervalos causan un batimiento disonante. Por esta razón, estos intervalos consonantes no son usados en el registro de bajo en las composiciones musicales.

figura 11

figura 11

La consonancia de los intervalos entre sonidos complejos puede derivarse de las consonancias de las combinaciones de sonidos simples contenidos en ellos. En estos casos la disonancia es el elemento aditivo; la disonancia de todas las combinaciones de parciales vecinos puede ser determinada y añadida para alcanzar la disonancia total (o la consonancia total) entre los sonidos. Sonidos con parciales espaciados, por ejemplo el clarinete (toca solo los parciales impares) son más consonantes que los sonidos parciales muy juntos.

La consonancia de un intervalo musical, definido como la suma de dos sonidos complejos con una cierta relación en su frecuencia fundamental, es altamente dependiente de la simplicidad de la relación de frecuencia. Intervalos con relaciones de frecuencia que puedan ser expresados en números pequeños (digamos, menos de 6) son relativamente consonantes porque los componentes más graves (los más importantes) de ambos sonidos están o muy separados o coinciden. Si la relación de frecuencia es menos simple, habrá un número de parciales de ambos sonidos que difieran sólo un poco en su frecuencia, y estos pares de parciales dan lugar a la disonancia. Parece que intervalos con el número 7 en sus proporciones de frecuencia (7/4, 7/5, etc.) están en el límite entre consonancia y disonancia.

La consonancia musical en la música polifónica y armónica occidental está claramente basada en la consonancia perceptiva de sonidos complejos (armónicos). Intervalos con relaciones de frecuencia simples son consonantes; intervalos con relaciones de frecuencia no simples serán disonantes.


página de inicio página de inicio de la EUM