ACOUSTIQUE MUSICALE,
PSYCHOACOUSTIQUE
ET SCIENCES COGNITIVES

par Pascal Pistone

"L’Art est fait pour troubler, la Science rassure."
(Georges Braque)

 

 

TABLE DES MATIERES

NOTIONS D’ACOUSTIQUE MUSICALE

I- LES ONDES SONORES

II- LE SONAGRAMME

III- LA PROPAGATION DU SON

IV- LA PROPAGATION EN PRESENCE D’OBSTACLE

V- LA RESONANCE

INITIATION A LA PSYCHOACOUSTIQUE

I- L’APPAREIL AUDITIF

II- L’ORIENTATION AUDITIVE

III- LA PERCEPTION DU NIVEAU SONORE

IV- LA PERCEPTION DU TIMBRE

V- LA PERCEPTION DES HAUTEURS

VI- LA PERCEPTION DES INTERVALLES

VII- LE BRUIT


INTRODUCTION AUX SCIENCES COGNITIVES

I- PRÉAMBULE

II- LA THEORIE DE L’INFORMATION

III- LA GESTALTTHEORIE

IV- LE STOCKAGE ET LE TRAITEMENT DE L’INFORMATION

V- MUSIQUE ET PSYCHANALYSE

VI- MUSIQUE ET SCIENCES DE L’HOMME

VII- CONCLUSION


ELEMENTS D’ELECTROACOUSTIQUE

I- LA SYNTHESE SONORE

  • 1- la synthèse additive
    2- la synthèse soustractive
    3- la synthèse FM
    4- la synthèse croisée

II- LES FILTRES

III- LE MIDI

IV- L’ECHANTILLONNAGE

  • 1- l’analogique et le numérique
    2- la fréquence d’échantillonnage
    3- la résolution


ORIENTATION BIBLIOGRAPHIQUE



NOTIONS D'ACOUSTIQUE MUSICALE


I - LES ONDES SONORES

1) les ondes périodiques simples (ou ondes sinusoïdales)

Considérons le balancier d’un pendule.

Représentons les phases principales de ce mouvement par un oscillogramme indiquant l’amplitude a (en ordonnée) par unité de temps (en abscisse).

Une onde périodique est composée de plusieurs cycles identiques qui se répètent. Ce mouvement périodique simple correspond également au mouvement produit par l’émission d’un signal sinusoïdal (appelé aussi son pur) sur une molécule d’air, transmettant ainsi cette même vibration à sa voisine.

La fréquence N, mesurée en Herz (Hz), est le nombre de cycles par seconde.
La période T (en secondes) est la durée d’un cycle. Elle est donc égale à 1/N.
La phase correspond à l’instant où l’onde coupe l’abscisse (où l’amplitude est nulle).

Le signal sinusoïdal ne peut être produit que par un générateur de sons. Tous les autres sons seront par conséquent le résultat d’ondes dites complexes.


2) les ondes complexes périodiques (instruments à cordes frottées et à vent)

Superposons maintenant plusieurs ondes sinusoïdales de fréquences et d’amplitudes différentes.

Il est possible de calculer ainsi point par point la forme de l’onde complexe qui en résulte.

LOI DE FOURIER (mathématicien du XIXe siècle) : ”Une onde complexe est une superposition d’ondes sinusoïdales dont le nombre, et l’intensité déterminent le timbre.” L'ensemble de ces composants sinusoïdaux s'appelle le spectre.

Dans le cas d’une onde complexe périodique, chacun des composants s’appelle un harmonique dont la fréquence est toujours un multiple entier de la fréquence du fondamental (N, 2N, 3N, 4N…).

Voici les 16 premiers harmoniques d’un do1 (série de Fourier) :

L'harmonique 1 est appelé également le fondamental et correspond généralement à la fréquence perçue par l'auditeur. L'indice de chaque harmonique correspond d'ailleurs à ce nombre entier (ex : fréquence de l'harmonique 7 = 7N). Ainsi la différence entre les fréquences de deux harmoniques de rangs voisins sera toujours égale à la fréquence du fondamental (ex : 9N - 8N = N).

Si le fondamental est absent, la note entendue correspondra néanmoins à la fréquence de celui-ci, et non à celle de l’harmonique 2.

Exemple : Soit des harmoniques de fréquences 200 Hz, 300 Hz, 400 Hz, 500 Hz. La fréquence entendue correspondra à la différence entre les fréquences de 2 harmoniques de rangs voisins, c’est-à-dire 100 Hz.

Les harmoniques entretiennent donc entre eux des rapports numériques constants. Par exemple, l'harmonique 3 est toujours dans le rapport 3/2 avec l'harmonique 2, et toujours une quinte au-dessus de lui; c’est pourquoi on exprimera la quinte dans le rapport 3/2. Même principe pour tous les autres intervalles présents dans la série harmonique.
Dans une série harmonique, les intervalles sont de plus en plus petits. En théorie, le nombre d'harmoniques est infini, mais après quelques dizaines, ceux-ci n'ont plus assez d'énergie pour être réellement présents.

Question : Sachant que la fréquence du la3 (la du diapason) est de 440 Hz, quelle est la fréquence du ré4 ?
Réponse : Le ré4 se trouve une quarte au-dessus du la3. La quarte se trouve dans un rapport de 4/3 (inverser la fraction pour calculer un intervalle descendant). La fréquence de ce ré4 est donc : 440 x 4/3 = 586 Hz.

Question : Soit une corde vibrante de 80 cm donnant un ré 3. Quelle note donnerait-elle si sa longueur était de 40 cm ?
Réponse : Calculons le rapport des 2 longueurs : 80 / 40 = 2 / 1 (ce rapport correspond à l'octave). En raccourcissant la corde, on obtient bien entendu une note plus aiguë (de fréquence supérieure). La nouvelle note est donc une octave au-dessus du ré3, soit un ré4.

LE SIGNAL EN DENT DE SCIE (cuivres et instruments à cordes frottées)

Ce type d'oscillations correspond à l'action de l'archet qui, grâce à la colophane, adhère à la corde et entraîne celle-ci en dehors de sa position de repos, jusqu'à ce qu'elle ne puisse plus suivre et reparte très rapidement en sens inverse tel un élastique que l'on tire au maximum.

Le signal en dent de scie est composé de tous les harmoniques (1N, 2N, 3N, 4N, 5N...).

LE SIGNAL CARRÉ (instruments à anches battantes : par exemple la clarinette)

Ce type d'oscillations correspond à l'action d'une anche dans un bec qui ouvre et ferme alternativement celui-ci pendant un certain temps d'arrêt. Une anche dure (donc très élastique) provoquera des allers et retours très rapides, engendrant un son riche en harmoniques. Une anche molle (moins élastique) provoquera des allers et retours plus lents : le signal se rapprochera alors d'une onde sinusoïdale (il sera plus pauvre en harmoniques).

Le signal carré est composé d'harmoniques de rang impairs (1N, 3N, 5N, 7N, 9N...).

Question : Quel est le signal engendré par des harmoniques de rang pair ?
Réponse : Soit 2N, 4N, 6N, 8N, 10N. Prenons comme valeur N = 100 Hz. Nous aurons 200 Hz, 400 Hz, 600 Hz, 800 Hz, 1000 Hz. Il se trouve que la différence entre les fréquences de 2 harmoniques présents consécutivement ici est toujours de 200Hz, c'est-à-dire la fréquence de l'harmonique le plus grave, qui sera par conséquent considéré comme un fondamental. Le son entendu correspondra en fait à un signal en dents de scie de fréquence 200 Hz.

3) les ondes (complexes) non périodiques (percussions, cloches, cordes pincées et frappées)

Dans le cas d'une onde non périodique, les fréquences des composants ne sont pas des multipes entiers de la fréquence du fondamental (1N - 2,1N - 3,2N - 3,9N - 4,3N...). Ces composants ne sont alors pas appelés harmoniques, mais partiels.


II - LE SONAGRAMME

Le sonagramme (temps en abscisse et fréquence en ordonnée) est une représentation plus proche que l’oscillogramme de l’image mentale que nous nous faisons des sons.

EXEMPLES

a) son sinusoïdal de 440 Hz
b) glissando ascendant d’un son sinusoïdal
c) son de clarinette de 1000 Hz (signal dont les harmoniques de rang impair sont renforcés)
d) son de cloche (les composants du spectre ne sont pas équidistants)
e) bruit blanc (à l’image de la couleur blanche qui contient toutes les fréquences du spectre sonore)
f) son de piano (reconnaissable par l'attaque percussive du marteau sur la corde)
g) son de flûte, sans l'attaque (contenant un bruit de souffle, proche du bruit blanc)

III - LA PROPAGATION DU SON

1) définition

Prenons l'exemple d'un jeu de billes suspendues à des fils. Si l'on provoque un impact de la bille A sur la bille B, celle-ci transmettra cette énergie à la bille C qui la transmettra à son tour à la bille D.
On dira alors qu'une onde s'est propagée de la bille A à la bille D.

Une onde est le résultat de l’ébranlement des molécules du milieu dans lequel il se propage (par exemple, les molécules d'eau autour d'une pierre jetée dans l'eau, ou encore les molécules d'air tout autour d'un impact). C'est pourquoi l'onde sonore (à la différence de la lumière) ne peut se propager dans le vide.

Le son peut en revanche se propager dans un gaz, un liquide ou un solide.

2) la célérité du son (c)

L'onde sonore implique une transmission d'énergie, et non un déplacement de matière : pour cette raison on utilisera le terme de "célérité" et non de "vitesse".

La célérité du son ne dépend ni de l'intensité, ni de la fréquence, ni du timbre. Elle dépend uniquement du milieu de propagation (340 m/s dans l'air à 15° C, 1450 m/s dans l'eau, 5100 m/s dans l'acier). De même,elle croit avec la température.

Nous sommes évidemment bien loin de la vitesse de la lumière qui est de l'ordre de 300 000 km/s.

Question : La célérité du son peut-elle interférer dans le jeu de plusieurs musiciens distants les uns des autres ?
Réponse : En théorie, non. Imaginons cependant un orchestre dont le percussionniste est placé à une vingtaine de mètres des premiers violons qui jouent tous des notes régulières, assez lentes, en pizzicato (c'est-à-dire avec une attaque très précise). Admettons que le percussionniste doive doubler ces notes de cordes par des coups de wood-blocks également très précis. Pour se caler sur eux, il les écoutera, mais avec un très léger décalage car le son des pizzicatos aura 20 mètres à parcourir avant de lui parvenir. Par ailleurs, chaque son joué par le percussionniste devra également parcourir 20 mètres pour arriver jusqu'au chef d'orchestre, placé à côté des violons. Il est alors probable que celui-ci entendra un décalage entre les pizzicatos et le jeu du percussionniste, décalage correspondant au temps mis par le son pour parcourir 40 mètres, soit plus d'un dizième de seconde.

3) la longueur d'onde

La longueur d'onde (L, noté lambda) est la distance que l'onde aura parcouru pendant la période T.

célérité (c) = distance / temps <=> c = L / T <=> L = c x T<=> L = c / N


IV - LA PROPAGATION EN PRESENCE D’OBSTACLES

1) la réflexion

La réflexion donne lieu à plusieurs types de phénomènes.

LA REVERBERATION

Dans le cas de la réverbération, les ondes réfléchies sont tellement nombreuses et rapprochées les unes des autres que l'auditeur ne peut les séparer, et perçoit comme une longue traînée sonore à la suite du son direct.

Le temps de réverbération (TR) est le temps en secondes mis par un son pour baisser de 60 dB. Il est proportionnel au volume de la salle et inversement proportionnel au coefficient d’absorption des parois.

- TR d’une salle de conférence = 1 s
- TR d’une salle de concert = 3 s
- TR de la cathédrale Notre-Dame de Paris = 8 s

Mais l'image sonore d'un lieu dépend aussi du délai de réverbération, c'est-à-dire du temps mis par le son pour être réfléchi la toute première fois (ce délai est court dans une petite salle).
Aujourd'hui, on reproduit souvent toutes ces données électroniquement, lors des enregistrements.

L'ECHO

Avec l'écho, on perçoit très nettement, entre le son direct et la première réflexion, un court silence d'au moins 50 ms (ce qui correspond à un obstacle distant d'au moins 8,50 m). En dessous de cette durée, on ne distingue pas les deux sons séparément.

Question : A quelle distance se situe un obstacle réfléchissant un son 2 secondes après son émission ?
Réponse : En 2 secondes, le son parcourt 340 x 2 = 680 m (correspondant à un aller et retour)
l'obstacle se situe donc à 680 / 2 = 340 m

LA FOCALISATION



2) l’absorption

a (noté alpha) est le coefficient d’absorption. Il est compris entre 0 (correspondant à une absorption nulle et donc une parfaite réflexion) et 1 (correspondant à une absorption totale).

Un obstacle peu élastique (un rideau par exemple), qui ne reprend donc pas sa position initiale après déformation par l'impact de l'onde sonore, est très absorbant : il ne réflechira qu'une faible partie de l'onde incidente.

Les fréquences aiguës (comme par exemple les composants aigus du spectre) sont généralement mieux absorbées, ce qui va inévitablement modifier le timbre.

3) la réfraction

La réfraction est provoquée par un changement de milieu en cours de propagation. Lorsque les valeurs d’impédance (caractéristiques de propagation) de deux milieux sont très éloignées, il y a une très faible communication de l'énergie lors du passage de l'onde sonore d'un milieu dans l'autre (par exemple, de l'air à l'eau, seul 0,1 % de l'onde est réfractée et pénètre dans l'eau).

4) la diffraction

La diffraction consiste, pour une onde, à contourner un obstacle ou à passer à travers une ouverture.

Un panneau réfléchit les fréquences ayant une longueur d’onde égale ou inférieure à sa dimension.

Question : Quelles fréquences un panneau de 0,3 m de côté réfléchit-il ?
Réponse : Toutes les fréquences égales ou supérieures à :
L = cT <=> L = c / N <=> N = c / L <=> N = 340 / 0,3 = 1133 Hz
(les fréquences inférieures à 1133 Hz seront donc diffractées)

C'est pourquoi les fréquences élevées sont plus facilement réfléchies, y compris par de petites parois.

5) l’acoustique architecturale

Aujourd'hui, on réalise des tests sur des maquettes représentant la salle à expérimenter. Si la maquette est au 1/10e, il faudra par exemple utiliser des sons de 5000 Hz que l'on diffusera et enregistrera à l'intérieur de celle-ci, afin d'entendre comment un son de 500 Hz sonnerait dans la salle réelle.

Les calculs sont difficiles à effectuer. C'est pourquoi on procède toujours à des corrections acoustiques, une fois la salle construite. Les salles polyvalentes à acoustique variable (Espace de projection de l’IRCAM) permettent, grâce à des panneaux coulissants, des plafonds réglables et des parois à coefficient d’absorption variable, d'adapter le lieu aux nécessités acoustiques du projet.


V - LA RESONANCE

1) définition

Prenons un résonateur : corps possédant une fréquence précise de vibration (la corde d'un piano) ou alors une bande de fréquences plus ou moins large (la caisse de résonance d’un violon).

Prenons également un excitateur : dispositif capable de communiquer une énergie vibratoire au résonateur
- sous la forme d'un ébranlement très bref (le choc d'un marteau de piano sur la corde) - ou sous la forme d'une force constante non oscillante (l'archet sur une corde ou le souffle dans un instrument à vent)
- ou encore sous la forme d'une force oscillante (c'est-à-dire possédant une fréquence propre)

Dans ce dernier cas seulement, à condition que la fréquence du résonateur soit très proche ou égale à celle de l'excitateur, celui-ci provoquera chez le résonateur des vibrations forcées importantes. Citons en guise d'exemple le cas des percussions qui, entrant en résonance avec d'autres instruments, peuvent se mettre à vibrer sans qu'on les touche. Ou encore les résonateurs (tubes accordés placés sous les lames du xylophone) qui permettent d'amplifier et de prolonger le son. Ou encore les cordes sympathiques du sitar indien qui ne vibrent que par résonance avec les autres cordes.

Citons encore les cordes aiguës du piano qui, excitées par les harmoniques de même fréquence contenues dans le spectre d'une note grave jouée, se mettent à vibrer toutes seules (à condition évidemment que les étouffoirs du piano ne bloquent pas les cordes).

Précisons également que le phénomène de résonance est d'autant plus fort que les fréquences de l'excitateur et du résonateur sont voisines l'une de l'autre.

2) les formants

Au XIXe siècle, Helmholtz conçut des résonateurs sphériques en verre qui permettaient de renforcer, pour un son émis à l'intérieur, l'harmonique de même fréquence que le résonateur (si un son de 100 Hz est envoyé dans un résonateur de 500 Hz, l'harmonique 5 sera alors renforcé).

Un harmonique renforcé s'appelle un formant. Nous en trouvons une parfaite application avec la cavité bucale de l'homme dont la taille est sans cesse modulable (modifiant ainsi sa fréquence de résonance) et qui produit différents types de formants à partir du son émis par les cordes vocales. Ce sont ces mêmes formants qui produisent la sonorité des différentes voyelles.



INITIATION À LA PSYCHOACOUSTIQUE


I - APPAREIL AUDITIF

L'appareil auditif est le premier organe des sens à se développer dans l'embryon. Sa complexité est très grande.

1) l’oreille externe

Elle sert à capter les ondes sonores. Elle comprend :
- le pavillon (que certains animaux peuvent orienter vers la source sonore)
- le conduit auditif

2) l’oreille moyenne

C'est une cavité de 2 cm3 qui comprend :
- le tympan (membrane élastique de 1cm2 de diamètre et de 1/10 mm d'épaisseur)
- la chaîne d'osselets (le marteau, l'encluuclume et l'étrier, maintenus par des muscles et des ligaments)
- la trompe d'Eustache (s'ouvrant sur l'arrière gorge à chaque déglutition afin d'adapter la pression atmosphérique de l'oreille moyenne à celle de l'environnement)

Les vibrations de l'air en provenance de l'oreille externe font vibrer le tympan qui transmet alors ses oscillations mécaniques à la chaîne d'osselets. On peut raidir celle-ci en contractant ses muscles : l'amplitude de l'oscillation mécanique sera alors atténuée et le son sera perçu comme étant moins fort.

3) l’oreille interne

Elle est remplie de liquide (un héritage de nos ancêtres aquatiques). Elle comprend entre autres :
- le vestibule. C'est le siège de l'équilibre. Si l'on tourne par exemple sur soi-même un certain temps et que l'on s'arrête brusqueme, l'endolymphe (un liquide) continue de tourner et le cerveau reçoit le message disant que le corps est toujours en mouvement. Cette information, supérieure à l'information visuelle qui sait que le corps est maintenant immobile, empêche notre corps de se tenir droit, et oblige nos jambes à trouver des appuis pourtant inutiles.
- la cochlée. Elle supporte plus de 25 000 cellules ciliées (cellules de Corti), chacune stimulée par une fréquence, qui contribuent à transformer les vibrations mécaniques en impulsions électriques envoyées au cerveau.

Cette impulsion est toujours de même amplitude quelle que soit l'intensité du son. Ce qui va caractériser un son fort, c'est le nombre plus important de cellules stimulées.


II - L’ORIENTATION AUDITIVE

1) la provenance

Il ne nous parvient jamais exactement les mêmes sons aux deux oreilles. C'est pourquoi on peut localiser les sons par :
- la différence de temps (le son met un temps différent pour atteindre chacune des 2 oreilles)
- la différence d’intensité (la tête jouant le rôle d'écran, le son s’amortit d’une oreille à l’autre, surtout pour les hautes fréquences)
- la différence de phase (les oreilles n'étant pas à égales distance de la source, les deux signaux reçus ne sont pas en phase)

2) la distance

Pour évaluer la distance d'une source sonore, l'oreille ne dispose d'aucun autre moyen d'évaluation que l'expérience. En effet, outre une différence de niveau, il existe également une différence de timbre entre un son proche et le même son plus lointain. Avec la distance, les composants aigus du spectre sont plus facilement absorbés que les composants graves, d'où évidemment altération du timbre. C'est par conséquent à travers la reconnaissance de ces nuances timbriques que l'oreille apprécie les distances, au fur et à mesure de son expérience.


III - LA PERCEPTION DU NIVEAU SONORE

1) la mesure de l'intensité

On prend souvent l'exemple des bougies pour démontrer que l'apport de luminosité est plus important lorsqu'on passe d'1 à 2 bougies, que lorsqu'on passe de 100 à 101 bougies. Ainsi démontre-t-on que la perception sensorielle suit une allure logarithmique. Il en va de même pour l'intensité (I).

LOI DE FECHNER (savant allemand du XIXe siècle) : “La sensation varie comme le logarithme de l’excitation”.
Le Bel (B) est une unité désignant un rapport de puissances acoustiques (w/m2). L'intensité se mesure généralement en Décibels (1 Bel = 10 dB).
Par convention, 0 dB sera la puissance minimale nécessaire pour qu’un son de 1 000 Hz soit tout juste audible.

Différents exemples d'intensité :
- bibliothèque (30 dB)
- conversation animée (50 dB)
- trafic urbain moyen (80 dB)
- marteau pneumatique (120 dB)
- seuil de la douleur (130 dB)

(on utilise des logarithmes décimaux)

Question : Un orchestre joue à 70 dB. On ajoute un autre orchestre jouant le même morceau à 70 dB également. Quelle est la nouvelle intensité produite par les deux orchestres ?

la nouvelle intensité sera de : 70 + 3 = 73 dB

En effet, chaque fois qu'on double la puissance acoustique, on gagne 3 dB.

Question : 4 haut-parleurs (HP) diffusent la même musique. Combien faut-il ajouter de HP pour augmenter l'innnut-il ajouter de HP pour augmenter l'intensité de 12 dB ?

<=> nombre total de HP = 16 x 4 = 64
il faudra ajouter : 64 - 4 = 60 HP

Question : 16 choristes chantent à l'unisson à 65 dB. Quelle est l'intensité produite par un seul choriste ?
Réponse : Sachant qu'on gagne 3 dB chaque fois que l'on double la puissance acoustique,
8 choristes chantent à 62 dB
4 choristes chantent à 59 dB
2 choristes chantent à 56 dB
1 choristes chantent à 53 dB

2) intensité et nuances musicales

110 dB est environ l'intensité maximum qu'un orchestre peut atteindre. Par ailleurs, on estime le bruit de fond présent dans une salle de concert à 40 dB, seuil au-dessus duquel il faut nécessairement jouer afin d'être entendu. Cela nous donne une dynamique possible de 70 dB (110 – 40 = 70). Sachant que 10 dB représente l'intensité minimum contrôlable par un musicien sur son instrument, nous aurons par conséquent 7 échelons d'intensité possibles (ce qui pourra correspondre au ppp, pp, p, mp, mf, f et ff).

3) la sonie

Les courbes isosoniques représentent l'ensemble des fréquences qui, à des intensités pourtant différentes, provoque la même sensation dynamique chez un même auditeur. Par exemple, le seuil d'audibilité d'un son de 400 Hz est à 20 dB, alors que pour un son de 40 Hz, il est à 70 dB.

La sonie (c'est-à-dire l'intensité subjective) est exprimée en Phones (Ph). Par convention, 1 Ph = 1 dB à 1 000 Hz.

Ecouter un enregistrement avec une faible intensité occasionne la disparition des fréquences (certains composants graves ou aigus du spectre) dont le seuil d'audibilité est au-dessus de cette intensité ce qui a pour effet d'altérer le timbre (le filtre loudness des chaînes hi-fi permet de renforcer l'ensemble de ces fréquences problématiques).

Autant l'oreille est très précise pour l'identification des hauteurs, autant cela lui est impossible en ce qui concerne la dynamique. En effet, à l'image de la pupille qui, par réflexe, se comprime après un flash lumineux, laissant entrevoir moins de lumière l'instant suivant, l'oreille percevra le même accord de nuance piano, moins fort s'il est précédé d'un accord forte, que s'il était précédé d'un accord pianissimo.


IV - LA PERCEPTION DU TIMBRE

Contrairement à la hauteur, à la durée ou à l'intensité, il n'existe pas d'unité de mesure pour caractériser le timbre. Celui-ci dépend de trois éléments :
- le spectre
- l'enveloppe
- l'environnement d'écoute

1) le spectre

Le spectre d'un son se caractérise par :
- le nombre de composants (un seul pour un signal sinusoïdal, quelques-uns pour certains sons de synthèse, des centaines pour des signaux complexes)
- la répartition des composants dans le spectre (harmoniques équidistants pour des sons périodiques, partiels non équidistants pour des signaux non périodiques)
- l’intensité de chaque composants (certains auront peut-être tellement d'énergie qu'ils seront des formants)

2) l’enveloppe

L'enveloppe se caractérise par :
- le transitoire d'attaque (attack)
- la phase de décroissance (decay)
- la phase de soutien (sustain)
- le transitoire d''extinction (release)

Un son de piano, sans le transitoire d'attaque, ressemble davantage à un timbre d'harmonium. De même, une attaque de flûte, suivie d'un son tenu de violon suggère néanmoins un instrument à vent. C'est dire l'importance de l'attaque dans la reconnaissance du timbre.

3) l’acoustique du lieu d'écoute

N'oublions pas que la réverbération modifie l'enveloppe du son et que, d'autre part, un son est sujet aux ambiances et aux résonances propres à chaque lieu.

Enfin il est intéressant de noter que la perception du timbre dépend de tous les autres paramètres du son :
- la hauteur (des composants du spectre)
- l'intensité (de ces mêmes composants)
- la durée (des transitoires de l'enveloppe)


V - LA PERCEPTION DES HAUTEURS

La tonie est la hauteur subjective que l'on attribue au son (alors que la fréquence est une mesure objective du son).

1) la tonie et la hauteur

LA HAUTEUR SPECTRALE

Nous avons déjà vu que l'oreille peut entendre un fondamental absent en reconstituant la fréquence comprise entre deux harmoniques de rang consécutif.

Alors que le signal non périodique du piano est généralement assimilé à un signal périodique (car il en est relativement proche), les partiels des spectres de bruit ne suggèrent aucune impression de hauteur déterminée, mais simplement de registre.

LA HAUTEUR FORMANTIQUE

Si l'on crée un formant au niveau par exemple de l'harmonique 3 d'un son, on entendra peut-être ce son à la quinte de sa fondamentale. Alors qu'un appareil de mesure électronique indiquerait à juste titre la fréquence du fondamental comme étant la véritable fréquence du son, l'oreille, elle, percevrait une tonie différente. Le compositeur Jean-Claude Risset a utilisé ce genre d'applications dans certaines de ses oeuvres électroacoustiques (sons circulaires, sons paradoxaux).

2) la tonie et l’intensité

Lorsque l'intensité s'accroît, les sons graves semblent baisser, alors que les sons aigus semblent monter.

3) la tonie et la durée

Cette théorie est hypothétique, mais cependant intéressante. On dit souvent que la seconde psychologique s'écoule plus ou moins vite en fonction du degré d'ennui ou de stress de l'individu. Prenons le cas d'un chanteur en situation de concert, donc en état d'excitation : sa seconde psychologique se trouvera raccourcie. Pendant cette seconde plus courte, une note chantée correspondant par exemple au la 3 n'aura pas le temps d'accomplir 440 vibrations comme elle devrait, mais peut-être seulement 430. Ainsi le chanteur aura-t-il l'impression d'être trop bas et chantera instinctivement plus haut. Est-ce la raison pour laquelle on constate souvent une montée du diapason lorsque le drame s'accentue ?

4) le vibrato

Un vibrato dépend de 2 paramètres :
- la profondeur de modulation (l’intervalle parcouru à chaque fluctuation)
- la vitesse (nombre de fluctuations par unité de temps)

Si la vitesse du vibrato est inférieure à 6 Hz (6 fluctuations par seconde), l’oreille entend une ondulation dont la variation de hauteur est tout à fait nette. Au-delà de 10 Hz, on perçoit un trémolo de notes différentes. En revanche, si la vitesse est comprise entre 6 et 10 Hz, ce n'est plus une variation de hauteur que l'oreille entend, mais une variation d'intensité.

Par ailleurs, la sonie d’un son vibré sera plus grande que celle d'un son droit (sans doute parce que davantage de cellules de Corti seront excitées).


VI - LA PERCEPTION DES INTERVALLES

1) la mesure des intervalles

Le Savart (s, noté sigma) correspond au plus petit intervalle perceptible par l'oreille humaine (un demi-ton = 25 savarts).

Cependant, on utilise plus généralement le Cent (un demi-ton = 100 cents).

2°) les registres extrêmes

L'octave d'une note correspond au double de sa fréquence. Pourtant, si l'on accorde les registres extrêmes d'un piano selon ce principe, l'oreille entendra des octaves un peu diminuées dans l'aigu et quelque peu augmentées dans les graves. C'est pourquoi un accordeur de piano doit se fier avant tout à ce qu'il entend.

3) les intervalles mélodiques

L'ATTRACTION
Dans certaines musiques, des notes donnent parfois l'impression d'être attirées par d'autres, comme la sensible vers la tonique dans un contexte tonal. Ce phénomène, uniquement culturel, incite l'oreille à ne pas considérer, par exemple, comme fausse (mais simplement comme tendue) une note sensible trop haute de 5 ou 10 savarts avant sa résolution.

LA TOLÉRANCE
Parfois l'oreille, consciemment tout d'abord, puis par automatisme, arrive à s'accommoder de notes perçues comme fausses par rapport à une échelle donnée (un piano mal accordé, un tempérament inégal entendu pour la première fois). Précisons que la plupart des notes produites par un chanteur seraient fausses (par rapport au tempérament égal) pour un instrument de mesure électronique.

4) les intervalles harmoniques

LES BATTEMENTS
Alors que ce n'est pas le cas pour les intervalles mélodiques, l'oreille se révèle extrêmement fine pour la perception des intervalles harmoniques, grâce aux battements qui se manifestent entre deux fréquences proches l'une de l'autre.

LES SONS SOUSTRACTIFS
Superposons deux sons sinusoïdaux de 600 Hz et de 800 Hz. Ces deux signaux correspondront en fait aux harmoniques 3 et 4 d'un fondamental absent de 200 Hz (son soustractif) que l'oreille reconstituera et entendra avec les autres. Ajoutons aux deux signaux précédents (600 et 800 Hz), un troisième son sinusoïdal de 700 Hz. Le son soustractif ne sera plus maintenant de 200 Hz, mais de 100 Hz, car les trois signaux joués correspondront désormais aux harmoniques 6, 7 et 8 d'un fondamental de 100 Hz.


VII - LE BRUIT

1) définition

Le bruit est un son indésirable, que l'on ne souhaite pas entendre et qui gêne la perception d’un autre signal. Un même son peut être un bruit pour certains, mais pas pour d'autres.

2) l’émergence

L'émergence d'un signal, par dessus un bruit de fond par exemple, ne dépend pas tellement des rapports d'intensité, mais surtout de la forme et de la tessiture du signal par rapport au fond général. Dans l’exemple ci-dessous aiguë de nuance MP sera tout à fait audible et distincte, malgré le cluster grave joué ff en même temps : c’est parce que c’est la seule note jouée dans ce registre.

3) les traumatismes auditifs

Un bruit intense ou incessant entraîne chez l’individu des troubles du métabolisme (fatigue, agressivité...). Certains sons de basse fréquence, à très forte intensité, peuvent même entrer en résonance avec des parties du corps humain et les affecter.

Outre le vieillissement, l’écoute d’une musique à un niveau sonore important (comme dans certaines discothèques) altère les facultés auditives. La plupart des personnes âgées ne perçoivent plus les fréquences supérieures à 10 000 Hz, c’est-à-dire qu’elles entendent un spectre moins large dont le timbre est par conséquent modifié. C’est la disparition de ces composants aigus (où est contenue l’intelligibilité de la parole) qui rend parfois difficile la compréhension d’un interlocuteur.



INTRODUCTION AUX SCIENCES COGNITIVES


I - PREAMBULE

En Occident, le passage d’une époque à l’autre est souvent synonyme de mutation esthétique, de bouleversement, parfois d’incompréhension, à l’image du conflit des générations (contrairement à d'autres cultures - par exemple africaine - dont l'art n'a pas cherché à évoluer constamment). Au XXe siècle, époque qui a vu foisonner, se confronter et même s’affronter le plus de tendances artistiques diverses, il est difficile pour un individu donné de ne pas préférer une esthétique à une autre. Certains diront que l’art contemporain est incompréhensible, d’autres qu’ils ne comprennent pas l’intérêt de la musique techno (nous noterons d'ailleurs à quel point la notion de compréhension est fréquemment sollicitée pour manifester ses goûts). Bien sûr le goût artistique est propre à la personnalité de chacun, mais à la différence des empreintes digitales, il n’est pas immuable et change de jour en jour. Les diverses théories scientifiques que nous allons aborder vont nous permettre de mieux l’appréhender.

La poésie lue, tout comme la musique, sont des arts inscrits dans le temps, c’est-à-dire qu’ils sont constitués d’éléments transmis par un comédien ou un musicien à un auditeur. Aussi allons-nous commencer par retenir ce premier aspect lié à la communication d’événements.


II - LA THEORIE DE L’INFORMATION

1) notions

Cette théorie (élaborée par Shanon dans les années 40) implique, pour qu’un message soit transmis :
- un émetteur qui envoie le message avec un certain débit
- un récepteur qui le reçoit
- un répertoire comprenant tous les symboles (signes codés) utilisés dans le message
- une opération de codage (par l’émetteur) puis de décodage (par le récepteur) afin de traduire tous les signes (impliquant évidemment un code commun à l’émetteur et au récepteur)
- un canal de transmission véhiculant le message depuis l’émetteur jusqu’au récepteur

Au cas où le canal détruirait certaines parties du message (par filtrage ou paajout de bruit de fond), ces parties manquantes pourraient être reconstituées par le récepteur grâce à la redondance introduite dans le message. Considérons par exemple la phrase ”je vais au théâtre”; si le pronom ”je” n’est pas entendu, le mot ”vais” indiquera néanmoins qu’il s’agit de la première personne du singulier : c’est une forme de redondance.

La prévisibilité de certains éléments du message facilite également sa compréhension, c’est-à-dire son intelligibilité.

Enfin, la quantité d’information représente en quelque sorte l’originalité du message, ce qu’il nous apprend de nouveau : elle sera donc inversement proportionnelle à la prévisibilité (on n’apprend rien si on connaît tout d’avance) et inversement proportionnelle au taux de redondance (il y a peu d’information contenue dans un message qui se répète beaucoup).

Mais si la quantité d’information est trop importante, l’intelligibilité sera réduite (une démonstration scientifique complexe lue à toute vitesse sera incompréhensible). D'ailleurs, cette particularité propre à la perception a fait l’objet d’une véritable prise de conscience, dans les années 50, de la part des compositeurs sériels qui, dès lors, ont cru devoir réintroduire dans leurs oeuvres les notions de prévisibilité, de détermination et de périodicité.

2) mesure de la quantité d’information

H : quantité d’information en bits (BInary digIT)
N : débit de signes par secondes
t : temps en secondes
n : nombre de symboles contenus dans le répertoire
pi : probabilité d’occurrence des symboles
log(2) signifie logarithme binaire

Exemple : Est-il plus de 15 heures ? La quantité d'information contenue dans la réponse ”oui ou non” (n = 2 et pi = 1/2) sera alors :

En fait, lorsque la question suppose une seule réponse parmi x réponses toutes aussi probables les unes que les autres, la formule peut alors se résumer à : H = log(2)x

Exemple : Choisissons un nombre compris entre 1 et 32. La quantité d’information comprise dans la réponse est : H = log(2)32 = 5 bits
En réalité, la quantité d’information est égale au logarithme binaire du nombre de réponses ”oui ou non” permettant de décrire ou d’avoir cette information. Dans l’exemple précédent (où H = 5 bits), nous pouvons connaître la réponse en posant les 5 questions suivantes :
- Le nombre choisi est-il compris entre 1 et et 16 inclus ? – Non. (Il est donc compris entre 17 et 32.)
– Est-il compris entre 17 et 24 ? – Oui.
- Est-il compris entre 17 et 20 ? – Oui.
- Est-il compris entre 17 et 18 ? – Non. (Il est donc compris entre 19 et 20.)
- Est-ce 19 ? - Non. (c'est donc 20.)

On imagine par conséquent la quantité d’information contenue dans un tableau et le nombre de questions qu’il faudrait poser afin de le décrire très exactement.

En musique, c’est encore plus complexe dans la mesure où cet art s’inscrit dans le temps : il y a donc un débit, généralement important. D’ailleurs, selon la théorie de l’information, le débit maximum d’informations perceptibles et compréhensibles est de 10 à 20 bits par seconde.

3) information sémantique et information esthétique

Le discours musical s’appuie en permanence sur des notions telles que la prévisibilité ou la redondance. Prenons par exemple le cas de la cadence rompue (appelée à juste titre en italien cadenza d’inganno, cadence trompeuse) dans laquelle la prévision de l’enchaînement dominante-tonique est déjouée au profit d’un autre degré. De même, la redondance présente dans toute oeuvre tonale est évidente, ne serait-ce que par l’utilisation des notes d’une même gamme, ou à travers les répétitions ou réexpositions de thèmes. Ce sont ces paramètres qui définissent chez l’auditeur le degré de connaissance d’un style musical, l’ensemble des repères lui permettant de maîtriser l’approche d’une oeuvre.

Par ailleurs, il est bien connu que le fait d'écouter plusieurs fois une oeuvre musicale peut contribuer à mieux l'apprécier. Nos goûts auront-ils changé pour autant ? En réalité, c’est la succession des événements qui sera davantage prévisible, réconfortant ainsi notre écoute grâce un univers sonore connu. On aime souvent ce qu’on prévoit et ce qu'on reconnaît.

Néanmoins, contrairement à l’information sémantique (traduisible dans toutes les langues), l’information esthétique, quant à elle, puise bien souvent son intérêt dans l’ambiguïté de ses symboles (ce qui est fréquent en poésie, flagrant en musique) et dans son débit important, rendant le discours artistique, du point de vue de la théorie de l’information, inintelligible. A l’inverse, une oeuvre musicale minimaliste et répétitive (par conséquent pauvre en quantité d'information) sera-t-elle pour autant inintéressante ou ennuyeuse ? Nous savons bien qu’une note répétée indéfiniment, avec le même rythme et la même nuance, peut créer un certain climat contemplatif.

Nous ne devons pas négliger en effet l’importance de la forme, de l’organisation temporelle ou spatiale d’une oeuvre. Il s’agit de bien prendre en considération la supériorité de l’agencement des signes, sur le signe lui-même.


III - LA GESTALTTHEORIE (la théorie de la forme)

1) forme et perception

”Nous définirons une Forme (Gestalt) comme un groupe d’éléments perçus dans leur ensemble, comme n’étant pas le produit d’un assemblage au hasard.” (MOLES Abraham, Théorie de l’information et perception esthétique)

On comprend que, dans l’écoute d’une oeuvre musicale, la forme implique la mémoire (par exemple la référence à des flash back permanents pour identifier une réexposition thématique). De même, elle implique aussi la prévision d’éléments attendus (qui seront joués ou non) devenant ainsi en quelque sorte une conscience de prévisibilité. Réminiscence du passé et projection dans le futur deviennent alors les moteurs de l’appréciation formelle d’une oeuvre.

La forme dépend par conséquent essentiellement du récepteur2 (de celui qui écoute), et donc de ses acquis, de sa culture et de son conditionnement (certains considèrent même, depuis la physique quantique, que rien n'existe en dehors de la perception). Comme il ne peut pas percevoir et traiter absolument toutes les informations qu’il reçoit (on a vu plus haut que le débit d’informations perceptibles et compréhensibles était limité), il est obligé de sélectionner. C’est évidemment en fonction de son expérience et de son vécu qu’il procédera à sa propre sélection. Cela lui permettra la plupart du temps de simplifier la forme entrevue : on sait par exemple que la perception d’une figure géométrique très complexe se réduit souvent à la vision d’une figure plus simple.

2) forme et structure

Par ailleurs, la forme ne se résume pas tout simplement à la somme de ses parties ou des éléments qui la composent. Cela devient un nouvel élément à part entière, un supersigne constitué de signes souvent moins perceptibles que l’ensemble produit. Les gestaltistes (les théoriciens de la forme) montrent par exemple que, dans la lecture du mot PIANO, nous percevons le mot dans son ensemble, avant de le considérer comme une juxtaposition des lettres P, I, A, N et O. De même, en regardant le dessin ci-dessous, nous distinguerons au premier regard un visage, et non un assemblage de cinq cercles de diamètres divers.

Précisons néanmoins que, jusqu’à présent, nous n’avons, à travers la théorie de l’information et la Gestalttheorie, entrevu que le point de vue formaliste, selon lequel la musique, par exemple, pourrait être réduit simplement au jeu de ses formes. Il serait par conséquent intéressant d’examiner la conception expressionniste. Afin d’appréhender ce propos, essayons maintenant d'entrevoir le cheminement dans le cerveau des informations perçues.


IV - LE STOCKAGE ET LE TRAITEMENT DE L’INFORMATION

1) schéma fonctionnel du système auditif

De même que les informaticiens se sont souvent inspirés du cerveau humain dans leur recherche, on utilise parfois des schémas empruntés à la cybernétique pour appréhender la manière dont le cerveau traite les informations sensorielles. Il s’agit pour le cybernéticien, non pas de décrire avec la plus grande précision possible la réalité afin de la reproduire exactement, mais plutôt de simuler son fonctionnement.

Rappelons que le son pénètre par l’oreille externe sous la forme d’une oscillation mécanique, traverse l’oreille moyenne, puis est transformé en impulsion électrique par l’oreille interne. Le signal, par l’intermédiaire du nerf auditif, gagne alors les fonctions supérieures (le cortex) pour être traité.

De manière plus abstraite, voici ce qu’il advient ensuite.

Le signal intègre tout d’abord la mémoire instantanée pendant une seconde environ. Il est transmis ensuite à l’ordinateur central qui, incapable pour l'instant d’identifier l’information reçue, s’adresse alors aux mémoires de stockage afin de prendre connaissance des représentations mentales qui lui sont associées. Il pourra par la suite conserver cette information, c’est-à-dire lui assigner une adresse par laquelle il sera possible de la retrouver plus tard. Toute information ne passant pas l’ordinateur central est néanmoins enregistrée dans les mémoires de stockage, mais aucune adresse n’ayant été conservée, il sera en principe impossible de la retrouver (l'hypnose est d'ailleurs l’une des techniques permettant parfois de retrouver ces informations sans adresse).

D’autre part, l’ordinateur central a la possibilité de modifier sensiblement certaines caractéristiques du signal perçu, cela en agissant directement sur les muscles de l’oreille moyenne, permettant ainsi de mieux entendre un timbre ou un registre bien précis. Il s’agit en fait d’une modification de la courbe de réponse de l’appareil auditif par le système ossiculaire de manière à favoriser l’émergence des formants propres au signal désiré. L’individu percevra objectivement plus fort le son sur lequel il se concentre, acquérant ainsi la capacité par exemple d’isoler une voix ou un timbre particulier.

2) notion de compréhension musicale : les grilles d'écoute

Deux jumeaux élevés ensemble n’auront pas le même caractère, la même perception des choses, car ils trieront différemment les informations reçues. On ne peut pas traiter toutes les données que nous percevons. Il faut par conséquent les sélectionner. Notre culture et notre éducation nous apprennent aussi à le faire.

Une oeuvre musicale contient une quantité d’informations qui dépassent largement notre capacité de traitement, c’est pourquoi nous remmarquons surtout les signes que nous reconnaissons.

Comprendre une musique, c’est en quelque sorte assigner des représentations mentales à ce que l’on entend. On applique toujours instinctivement sa propre grille d’écoute quelle que soit la musique entendue. C’est pourquoi il y a parfois tant d’incompréhension entre des cultures différentes.

TEXTES CITÉS dans La Machine à écouter d’Emile Leipp :

Berlioz, parlant des musiciens chinois qu'il avait entendus à Londres en 1851 écrit : “Air grotesque et abominable en tous points, finissant sur la tonique ainsi que la plus vulgaire de nos romances... Les Chinois et les Indiens auraient une musique semblable à la nôtre s'ils en avaient une; mais ils sont à cet égard, plongés dans les ténèbres les plus profondes de la barbarie... De plus, les Orientaux appellent “musique” ce que nous nommons “charivari”, et pour eux, comme pour les sorcières de Macbeth, l'horrible est le beau. (...) Le peuple chinois chante comme les chiens baillent, comme les chats vomissent quand ils ont avalé une arête."

Tran Van Khe, parlant des musiciens orientaux, signale que “le public oriental, habitué à la monodie où tout le monde s'exprime à l'unisson, est totalement dérouté par les sons des musiques occidentales qui s'entrecroisent, se heurtent, se superposent." Plus loin, le même musicologue, citant un musicien arabe, Mohammed Zerrouki, précise : “Pour le public oriental, un orchestre occidental groupe des musiciens qui ne tiennent nullement le même langage. Chaque exécutant dit en toute indépendance ce qu'il lui plaît de dire. Les musiciens semblent se tourner le dos et ne point s'entendre mutuellement. En pleine exécution, certains d'entre eux reposent leur instrument, laissant les autres discourir; puis, s'avisant qu'ils ont leur mot à dire, ils s'évertuent à rattraper leurs camarades. Au-dessus de leur tête, gesticule de mille manières un chef d'orchestre à qui personne ne songe à obéir sérieusement. En un mot, aucun ordre apparent. L'oriental ne peut s'empêcher de penser que toute discussion doit suivre un processus précis et que chaque thèse doit se faire entendre, se développer séparément. Pour se faire comprendre, il faut que chacun parle à son tour. Si l'on parle tous à la fois, en disant des choses différentes, comment se faire entendre ? Seuls les gens en colère ou des fous se comportent de cette façon. Voilà grosso modo le raisonnement qui vient inévitablement à l'esprit de l'Oriental n'ayant point reçu d'éducation musicale européenne."

Nous heurtant alors à la subjectivité de l’individu et à la complexité de son inconscient, nous sommes obligés cette fois de prendre en considération la dimension psychanalytique.


V - MUSIQUE ET PSYCHANALYSE (théories sur l’utilité de la musique)

Les rapports entre la musique et la psychanalyse ne font pas l’objet de théorisation synthétique (sans doute en raison de l’absence du discours musical chez Freud), mais plutôt de spéculations métapsychologiques ou d’analogies trop générales entre paramètres musicaux et paramètres psychanalytiques.

Pour certains, l’écoute de la musique, par son organisation intelligible, libère l’énergie permettant de maîtriser les stimuli sonores inorganisés (en particulier non maîtrisables par le langage) qui constituent pour le nourrisson la menace d’un monde extérieur effrayant. Cette libération d’énergie, dominant cette peur primitive du son, serait l’origine même du plaisir musical. On peut également supposer que la musique, tout comme la phase de sommeil paradoxal (le rêve), permettrait, pendant l’écoute, une organisation structurelle mémorielle de toutes les informations acquises dans la journée (cela n’est pas sans nous rappeler cette phrase de Leibniz : ”La musique est un exercice d’arithmétique inconscient de l’esprit qui ne sait pas qu’il est en train de compter”).

Pour d’autres, la musique serait également un mode spécifique de communication mère-enfant, où celui-ci trouverait un fondement du rythme (dans la périodicité de son alimentation) et de la mélodie (à travers la berceuse maternelle). La musique, sublimation des éléments de l’enfance, deviendrait plus tard une quête éternelle de nouveaux substituts de l’objet perdu. Elle pourrait même provoquer une régression rétablissant une communication avec les expériences archaïques, autorisant la décharge de tension primitive.

De même, l’influence du conscient et de l’inconscient dans le phénomène musical est très discutée. Certains supposent que la musique, provoquant un état de dissolution de la conscience, donne accès à des représentations et à un matériau refoulé, utilisant son ambiguïté sémantique pour tromper la censure. L’écoute musicale, impliquant comme le rêve des chaînes associatives, serait alors un moyen d’accéder au refoulé. Cet aspect sémantique est important; alors que Saussure n’y voit qu’un jeu de signifiants sans référence directe à un signifié, d’autres considèrent même la musique comme une paraphrase du langage.

N’oublions pas que, quelle que soit l’époque considérée, quels que soient les pays, les cultures, les traditions, les ethnies, la musique est présente chez tous les peuples de la terre, comme si elle était, et tout l’art avec elle, vitale pour l’être humain.

Pour la première fois, nous trouvons une trace d’universalité dans l’art, à travers son utilité. Afin de sortir du champ théorique, abordons maintenant le domaine de l’expérimentation. Les études sur la perception, menées chez un grand nombre de sujets, nous permettent-elles d’entrevoir une trace d’universaux ?


VI - MUSIQUE ET SCIENCES DE L’HOMME (pour une universalité de la perception musicale ?)

Les partisans de l'expressionnisme, selon lesquels la musique est dotée d’un pouvoir d’expression, se divisent en deux groupes bien distincts (FUBINI, Enrico, Les Philosophes et la musique). D’une part, les absolutistes pensent que ce pouvoir expressif est véritablement contenu dans la musique elle-même. C’est le cas à la fois d’un courant néo-pythagoricien évoquant un ordre intelligible inscrit dans le cosmos (ordre que les sons reflètent), ainsi qu’un ensemble de musicothérapeutes qui essayent de mettre en évidence certains effets physiologiques liés à la musique, une mise en résonance des organes corporels par les vibrations sonores. Pour certains d’entre eux, cette résonance neuro-musculaire serait à l’origine même de l’émotion musicale : la musique nous émeut parce qu’elle nous remue (au sens le plus littéral du mot).

Cependant, l’étude des fonctions cardio-vasculaires et des fonctions respiratoires, aboutissant souvent à des résultats contradictoires, ne peuvent être ramenée à une réduction du type stimulus-réponse, ces effets physiologiques dépendant essentiellement de l’attitude du sujet lors de l’écoute et de son conditionnement. Ainsi devons-nous enfin considérer le point de vue des référentialistes, selon lesquels la compréhension du contenu expressif n’existe que par référence au monde extérieur et à des phénomènes d’acculturation : nous voyons ainsi l’importance que revêtent en musique les fonctions supérieures. En fait, il n’y a pas de comportement physiologique déterminé pour une structure musicale donnée.

D’autre part, si les mécanismes périphériques de l’audition sont de mieux en mieux étudiés, les phénomènes centraux liés à la neurologie (aire de projection auditive sur le cortex) sont encore très mal connus. En effet, l’étude électroencéphalographique permet uniquement de connaître le degré d’attention du sujet à une musique donnée. Cependant, on a constaté, de façon empirique, que certains stimuli, comme un son répété monotone, provoqueraient chez tout sujet une baisse de la vigilance et l’induction au sommeil (il est vrai que la plupart des berceuses utilisent des éléments répétitifs). Pourtant, là aussi, nous ne pouvons ramener l’écoute musicale à une simple activité réflexe (liée uniquement au cerveau inférieur). Nous devons convenir encore de l’importance de l’acculturation et de la culture.

De plus, on a démontré l’absence de fondements neuro-psychologiques dans la signification attribuée à certains éléments musicaux. En effet, les associations accord consonant/ordre-équilibre-repos, accord dissonant/inquiétude-désir-tourment, mode majeur/gaieté, mode mineur/tristesse, registre grave/bas et registre aigu/haut n’existent que par transfert du rapport syntaxique dans le domaine psychologique à la suite d’une acculturation. C’est pourquoi, la religion, l’amour, la nature, l’héroïsme ne sont aucunement intrinsèques à la musique.

On comprendra alors pourquoi ces différents points de vue (psychiatriques, psychanalytiques, physiologiques, neurologiques, psychologiques) ont pris une position culturaliste (relativisme, antiuniversalisme) et renvoient directement à la sociologie.


VII - CONCLUSION

Nous avons vu avec la théorie de l’information que le codage du signal par le transmetteur implique un décodage équivalent par le récepteur. Pour autant, nous savons bien que le codage de l’idée par le poète sous la forme de juxtaposition de mots ne peut être interprété exactement de la même façon par le lecteur. L’art, et c’est en cela que réside tout son intérêt, repose sur une ambiguïté de sens. Pourtant, lorsque l’incompréhension entre le créateur et l’esthète est totale, pouvons-nous encore parler de message artistique ? Beaucoup d’Occidentaux avouent assister avec plaisir à une représentation de théâtre Nô, bien que la plupart ignorent absolument tout de la langue, des codes et des références employées. Les concepts de représentation mentale et de grille culturelle développés précédemment nous montrent bien que ces spectateurs voient ”autre chose” que ce qui est communiqué. Mais a-t-on pour autant le droit d’affirmer qu’ils en tirent moins de plaisir ?

Certains, malheureusement trop peu nombreux, puisent souvent leur intérêt et leur satisfaction dans l’exploration d’oeuvres inconnues, nouvelles, sans repères par rapport à des acquis culturels établis. S’exercer à percevoir une forme dans ce qui déroute, n’est-ce pas salutaire, selon certaines hypothèses psychanalytiques ? Cette démarche va à l’encontre de ce qui est pratiqué par exemple dans le marketing publicitaire de variétés : au lieu de susciter la curiosité pour une chanson ou pour un interprète dans l’esprit du public, incitant celui-ci à découvrir par lui-même et surtout à faire le choix de découvrir, on procède à un matraquage en diffusant le ”produit” par petites doses à la radio, à la télé, sur les affiches, dans la rue, dans le métro, sur les couvertures de magazines, de manière à créer une sorte d’accoutumance inconsciente qui poussera le consommateur à acheter, sans qu’il ait eu réellement à le décider.

L’homme a besoin, dans l’art, d’un cadre structuré. Et la structure, comme nous l’avons montré, il l’attribue à ce qu’il connaît, ou plutôt à ce qu’il reconnaît; la cohérence des uns est souvent l’incohérence des autres. Aussi toutes ces théories doivent-elles nous rendre plus humbles quant aux prétendues vérités artistiques. Le beau, la forme, le génie ne sont que des dimensions hallucinatoires nullement inscrites dans l’oeuvre elle-même; elles ne sont que des projections plus ou moins inconscientes de la part d’un esthète donné. Ronsard aurait-il pu entrevoir le talent de Mallarmé ? Sans doute pas.

En réalité, la lecture d’un poème devant dix auditeurs génère dix visions différentes de l’oeuvre, donc dix poèmes différents. A la fin d’une de mes conférences, un écrivain m’interpellait en me priant de ne pas oublier pour autant la vision du poète lui-même ! Pourtant celle-ci ne concerne-t-elle pas que l’analyste ? Il est parfois difficile pour un créateur d’accepter le fait que sa propre vision de l’oeuvre, ainsi que les sentiments qu’il y a inscrits, soient emmurés dans une dimension de l’ouvrage que personne d’autre ne pourra percevoir telle quelle : c’est le niveau poïétique (celui de la création), que Jean Molino, dans sa théorie de la tripartition, distingue du niveau neutre (celui de l’oeuvre) et du niveau esthésique (celui de la perception). Cette théorie a été largement développée par Jean-Jacques Nattiez dans les Fondements d’une sémiologie de la musique.

A partir de ce relativisme, hostile à toutes vérités prétentieuses et prosélytistes, nous pourrions, après avoir décrié l’objectivité du Beau, aller jusqu’à repousser les limites mêmes de l’oeuvre artistique... Mais c’est là un autre débat !



ÉLÉMENTS D'ÉLECTROACOUSTIQUE


I - LA SYNTHESE SONORE

1) la synthèse additive

Superposition de sons sinusoïdaux de fréquences et d’amplitudes différentes.

2) la synthèse soustractive

Filtrage d’un signal riche en harmoniques (principe des synthétiseurs analogiques).

3) la synthèse FM

Soit deux oscillateurs, appelés ici opérateurs. La fréquence du porteur est modulée par le modulateur.

Plusieurs opérateurs sont généralement utilisés, dont les différentes connexions possibles sont nommées algorithmes (6 opérateurs pour 32 algorithmes chez le ”DX7” de Yamaha).

4) la synthèse croisée

Application des variations de fréquences d’un signal aux variations d’amplitudes (l’enveloppe) d’un autre signal (le vocodeur permet par exemple de faire parler un instrument de musique).


II- LES FILTRES

Un filtre pass-haut élimine les composants graves du spectre sonore. C'est ce qui arrive à la voix transmise par un téléphone. Celle-ci reste néanmoins très compréhensible dans la mesure où l'intelligibilité d'une voix est surtout contenue dans la partie haute du spectre.

En revanche, un filtre passe-bas élimine les composants aigus du spectre, ne laissant passer que les graves, qui contiennent la majeure partie de l'intensité sonore (puisque les premiers composants du spectre sont ceux qui ont généralement le plus d'énergie).

Un filtre passe-bande, quant à lui, ne laisse passer que les fréquences comprises dans la banse passante sélectionnée.

Au contraire, un filtre coupe-bande filtre les fréquences comprises dans cet intervalle.

Prenons maintenant l'exemple d'un tout petit haut-parleur dont la taille ne permet pas de restituer les composants graves d'un son périodique. L'oreille restitue et entend malgré tout le fondamental, car celui-ci correspond à l'écart entre les fréquences des harmoniques supérieurs de rangs voisins joués par le haut-parleur. Cependant, ces composants aigus n'auront pas assez d'énergie pour être propagés loin des haut-parleurs (par exemple loin d'un casque de walkman). On retrouve notamment ce phénomène avec certains pianos droits dont la longueur des cordes les plus graves n’est pas suffisante pour émettre le fondamental; pourtant, l'oreille perçoit la hauteur du fondamental absent.


III - LE MIDI

Le MIDI (acronyme de “Musical Instrument Digital Interface”) est un système de communication universel entre les instruments de musique électroniques. Il résulte d’un accord (en 1983) entre les grandes firmes de fabrication.

Le langage MIDI est un codage numérique binaire de l’événement musical (ce qui n’a rien à voir avec le signal audio). L’information MIDI est représentée sur 10 bits :
- 2 bits, de valeur toujours 0, servent à la synchronisation (le start bit indique le début de l’événement et le stop bit en indique la fin)
- les 8 autres bits ont pour valeur 0 ou 1, ce qui représente, de 00000000 à 11111111, 256 valeurs différentes.

Le débit maximum du MIDI est de 3 125 bits par seconde (31 Kbit/s). Il indique des valeurs choisies parmi 16 canaux MIDI, 128 valeurs de notes, 128 valeurs de vélocité, etc.


IV - L’ECHANTILLONNAGE

1) l’analogique et le numérique

ENREGISTREMENT ANALOGIQUE : inscription du son par un signal continu constitué d’une infinité de valeurs (par exemple une tension électrique).

ENREGISTREMENT NUMERIQUE : inscription du son au moyen de nombres codés (par un convertisseur analogique/numérique) espacés d’un intervalle de temps. C’est ce que l’on appelle l’échantillonnage (on parlera également de numérisation, ou encore d’acquisition numérique). Il s’agit donc d’une représentation discontinue.

2) la fréquence d’échantillonnage

C’est le nombre de fois par seconde qu’un convertisseur analogique/numérique va transformer le signal en valeur numérique. Cette fréquence est de 44,1 KHz pour les CD (soit 44 100 sections instantanées du son à chaque seconde).

Pour un bon enregistrement, on considère que la fréquence d’échantillonnage doit être au moins égale au double de la fréquence la plus élevée à enregistrer.

On pourrait comparer la fréquence d’échantillonnage au nombre de photogrammes dans une pellicule cinématographique.

3) la résolution

Le son produit des variations de pression de l’air qui sont transformées par le micro en une tension mesurable. Lors de l’échantillonnage, le convertisseur transforme cette tension en nombres codés compris sur un certain nombre de bits.

8 bits permettent de coder 256 amplitudes différentes (= 28)
16 bits permettent de coder 65 536 amplitudes différentes (= 216)

En théorie, la dynamique maximale est de 6 dB par bit. Pour 16 bits, elle est donc de 6 x 16 = 96 dB.

On pourrait égalemet comparer la résolution à la taille et à la qualité des photogrammes de pellicules de cinéma.

La numérisation utilise beaucoup de mémoire. Par exemple, 1 mn de son stéréo échantillonné en 16 bits à 44,1 KHz utilise 10 méga-octets.



ORIENTATION BIBLIOGRAPHIQUE


ANSERMET Ernest, Les fondements de la musique dans la conscience humaine, Neuchâtel, A la Baconnière, 1/1961, 2/1987, 820 p.

ARVEILLER Jacques, Des musicothérapies, Issy-les-Moulineaux, EAP, 1980, 161 p.

BAILHACHE Patrice, Une histoire de l’acoustique musicale, Paris, CNRS, 2001, 199 p.

FICHET Laurent, Les théories scientifiques de la musique, Paris, Vrin, 1996, 382 p.

FRANCES Robet, La perception de la musique, Paris, Vrin, 1984, 426 p.

LEIPP Emile, Acoustique et musique, Paris, Masson, 1/1971, 4/1984, 376 p.

LEIPP Emile, La machine à écouter. Essai de psycho-acoustique, Paris, Masson, 1977, 262 p.

MARIE Jean-Etienne, L’homme musical, Paris, Arthaud, 1976, 360 p.

MC ADAMS Stephen et BIGAND Emmanuel, Penser les sons. Psychologie cognitive de l’audition, Paris, Presses universitaires de France, 1994, 408 p.

MC ADAMS Stephen et DELIEGE Irène, La musique et les sciences cognitives, Liège, Pierre Mardaga, 1989, 656 p.

MOLES Abraham, Théorie de l’information et perception esthétique, Paris, Denoël, 1972, 328 p.

“Musique et perception”, Inharmoniques, n°3, Paris, Christian Bourgeois, ma989, 656 p.

NATTIEZ, Jean-Jacques, Fondements d'une sémiologie de la musique, Paris, UGE, 1975, 448 p.

PIERCE John R., Le son musical. Musique, acoustique et informatique (trad. de l’anglais), Paris, Belin, 1984, 242 p.

RISSET Jean-Claude, “Timbre et synthèse des sons” (trad. de l’anglais), Analyse musicale, n° 3, avril 1986, p. 9-22.

SLOBODA John A., L’esprit musicien. La psychologie cognitive de la musique, Liège, Pierre Mardaga, 1985, 400 p.