Improvisation et son direct. Entre théories du son et mutations technologiques

Mouëllic, Gilles

doi:https://doi.org/10.7202/1023111ar

Ce texte se situe dans la continuité du travail que j’ai consacré à l’improvisation au cinéma, au cours duquel il m’est apparu évident que la possibilité d’un cinéma improvisé dépendait très concrètement des techniques, à la fois de l’évolution des techniques du cinéma et des choix techniques des cinéastes eux-mêmes. Si l’évolution des machines de vision et d’enregistrement est bien présente dans mon étude sur l’improvisation, son ambition essentiellement esthétique ne m’a pas permis d’en faire un véritable objet d’investigation. Le projet de recherche TECHNÈS [1] est pour moi l’occasion d’explorer de manière déterminée cette question et mon but est ici de délimiter un nouveau champ de recherche autour de l’élément sonore dans une perspective très large, qui dépassera sans doute la stricte question de l’improvisation, peut-être pour mieux y revenir. Dans ce texte, je situerai tout d’abord la question sonore dans la perspective qui est la mienne, en précisant l’importance du son dans une pensée mais aussi dans une pratique du cinéma qui tiendrait compte de la possibilité de l’improvisation comme mode de création. Ensuite, je reprendrai la question du son direct, qu’il s’agira de renouveler en partie en portant attention aux questionnements sur le sujet et aux expériences d’improvisation qui ont été rendues possibles par la télévision, notamment. Enfin, l’arrivée des caméras légères et peu bruyantes, associées à des systèmes d’enregistrement maniables et performants, fera l’objet d’une troisième partie dans laquelle la question essentielle du montage sera prise en compte.

1. Non-coïncidence

Commencer cette étude par un bref retour à Eisenstein et à quelques formalistes russes, dont les rapports avec l’improvisation sont pour le moins ténus, peut paraître assez curieux. Pourtant, le célèbre Manifeste « contrepoint orchestral », daté d’octobre 1928 et signé Eisenstein, Poudovkine et Alexandroff [2], détermine avec beaucoup de précision quels seront les problèmes posés aux cinéastes par l’arrivée du son et l’évolution des techniques d’enregistrement. Le manifeste définit clairement le son comme une technique (le mot revient à plusieurs reprises) dont il est essentiel d’évaluer les conséquences esthétiques. Les auteurs expriment rapidement leur crainte devant

le film parlant, celui dans lequel l’enregistrement de la parole coïncidera de la façon la plus exacte et la plus réaliste avec le mouvement des lèvres à l’écran et dans lequel le public aura « l’illusion » d’entendre des gens qui parlent, des objets qui résonnent, etc.
cité dans Eisenstein 1976, p. 20

Après avoir exposé les dangers d’une « invasion du théâtre à l’écran » et mis en garde contre l’inertie que ne manquera pas de provoquer « l’addition du son à des fragments de montage », les auteurs défendent « l’utilisation du son en guise de contrepoint [qui offrira] de nouvelles possibilités de développer et de perfectionner le montage » et concluent que « les premières expériences avec le son doivent être dirigées vers sa “non-coïncidence” avec les images visuelles » (cité dans Eisenstein 1976, p. 20).

Cette inertie supposée provoquée par la « tentation du théâtre » a fait couler beaucoup d’encre, et nous avons tous en mémoire les images sans doute un peu excessives de Singin’ in the Rain (1952), où Stanley Donen et Gene Kelly revisitent avec humour les techniques approximatives du premier cinéma parlant, quand l’arrivée du son ne manquait pas en effet de réduire à néant toute idée de mouvement. Si le cinéma sera très majoritairement « voco-centriste », comme l’écrira Michel Chion bien plus tard, des théoriciens reprendront à leur manière les hypothèses et suggestions d’Eisenstein pour affirmer à leur tour la possibilité de l’autonomie des différentes composantes de la bande sonore entre elles et par rapport à l’image. C’est le cas par exemple de Pierre Schaeffer dans la remarquable série de trois textes regroupés sous le titre « L’élément non visuel au cinéma » dans les numéros d’octobre, novembre et décembre 1946 de la Revue du cinéma [3]. Pour Schaeffer (cité dans de Baecque et al. 1992, p. 461-462), « le cinéma joue [avec les matériaux visuels et sonores] dans une liberté de rapports inconnue jusqu’ici et qui lui appartient en propre ». Prenant en compte les trois composantes de la piste sonore, de la plus réaliste (les bruits) à la moins réaliste (la musique) avec, entre les deux, la parole comme « bruit des hommes », il propose de considérer chacune d’entre elles comme élément d’une composition dont l’ambition musicale est sans cesse revendiquée. « On peut jouer sur la composition, l’intensité, la durée et le rythme des bruits », écrit-il, avant d’affirmer que « le texte a beaucoup moins d’importance que l’intonation des phrases, le grain des voix et jusqu’au degré d’intelligibilité » (cité dans de Baecque et al. 1992, p. 463). Cette ambition, fort légitime pour celui qui sera, quelques années plus tard, à l’origine des fondements théoriques et esthétiques de la « musique concrète » (ce qui est loin d’être anodin ici), se situe dans le prolongement du Manifeste en affirmant une posture de compositeur qui n’est cependant qu’esquissée par Eisenstein. On peut trouver des traces des propositions radicales de Schaeffer dans nombre de films (chez Orson Welles ou Alain Resnais, par exemple), mais Jean-Luc Godard est celui qui a expérimenté avec le plus de détermination cette possible indépendance des éléments sonores, s’affirmant même autant comme compositeur que comme cinéaste dans Nouvelle Vague (1990) [4] ou dans ses Histoire(s) du cinéma (1998).

Si j’ai pris le temps de considérer cette possible indépendance entre sons et images, ce n’est pas, comme on pourrait s’y attendre, pour m’en éloigner rapidement en lui opposant le son direct comme une sorte d’envers, mais pour affirmer au contraire que l’appétit de direct de certains compositeurs constitue une autre manière de prendre en compte cette indépendance. Ce qui m’intéresse ici est donc la manière dont certains cinéastes vont utiliser les techniques du son pour atteindre cette coïncidence redoutée par Eisenstein et bien plus délicate que le texte ne le laisse supposer, non pour satisfaire un besoin de réalisme mais pour en retirer d’autres perspectives créatrices fondées, elles aussi, comme l’écrit Schaeffer (cité dans de Baecque et al. 1992, p. 462), sur la liberté de rapports entre les matériaux sonores et visuels, liberté qui « appartient en propre » au cinéma. En parlant de simple « coïncidence » entre le mouvement des lèvres et la parole, les auteurs du Manifeste posent en effet le problème de la séparation entre l’enregistrement des images et l’enregistrement des sons, tout en évaluant immédiatement avec une grande lucidité les potentialités de cette partition en termes de montage. Mais cette partition ne sert pas seulement les desseins de « compositeurs » comme Godard, Resnais ou Welles : certains cinéastes, très éloignés d’Eisenstein, vont prendre rapidement conscience de la vitalité que peuvent acquérir les images à partir de cette absolue coïncidence que l’on peut peut-être déjà appeler son direct.

2. Renoir et Rozier

Renoir est, sans surprise, le cinéaste chez qui cet appétit de direct est le plus visible, bien au-delà de son aversion connue pour le doublage. La séquence la plus révélatrice à cet égard, sur laquelle je m’appuie souvent, est celle qui succède au générique de La règle du jeu (1939) : l’arrivée de l’aviateur André Jurieu à l’aéroport du Bourget, éclatante manifestation de la technique du son direct comme horizon du cinéma de Renoir. Ces quelques minutes de mise en scène du son, qui sont aussi analysables comme une mise en scène de l’improvisation simulée, suffisent pour comprendre ce que cherche Renoir à travers cette reconstitution d’un direct radiophonique qui ressemble beaucoup à ce que seront les directs à la télévision. Il montre à la fois la lourdeur de la technique (le technicien du son, casque sur les oreilles, face à son matériel, puis un second technicien qui dévide prestement le rouleau de câble) et la vitalité de cette jeune reporter, jouée par la journaliste Lise Élina, qui se fraie un passage dans la foule malgré cet inévitable câble qui l’attache au fameux camion du son. À travers elle, c’est le son qui tente d’exister dans la réalité de la foule venue accueillir André Jurieu, ce son qui donne à entendre, et donc à voir, le désordre du réel. Il ne s’agit là que de mise en scène à l’abri d’un studio, mais Renoir avait, dès Toni (1935), montré combien, malgré la complexité de la prise de son en extérieur, l’authenticité d’un univers ne pouvait se passer de l’enregistrement en direct des voix. Dans la première séquence de La règle du jeu, filmer la technique, c’est célébrer une modernité qui associe dans le même mouvement le cinéma, la radio, l’aviation… et la future télévision.

Plus de vingt années plus tard, dans le générique d’Adieu Philippine (1962), Rozier, admirateur de Renoir s’il en est, rend une forme d’hommage au « patron » en filmant l’enregistrement en direct d’une véritable émission de télévision, le n^o 26 de la série Jazz Memories, émission de Jean-Christophe Averty avec pour invité le clarinettiste Maxim Saury. On y découvre les caméras de télévision, les opérateurs, les techniciens, les câbles qui traînent, les micros, les déplacements des caméras montées sur roulettes, les tourelles qui permettent de changer rapidement d’objectif, les écrans de contrôle, la voix autoritaire d’Averty, les yeux rivés sur les écrans qui relaient les différentes caméras, improvisant le montage tout en anticipant les mouvements des opérateurs. L’analogie entre la polyphonie néo-orléanaise de l’orchestre de jazz, sous la conduite de Saury, et le désordre apparent du plateau, sous la direction d’Averty, est évidente : Rozier compare un tournage dans les conditions du direct à une performance de jazz Nouvelle-Orléans. Aux lignes mélodiques et rythmiques qui se superposent pour former un savant canevas répondent les panoramiques, le tournoiement des tourelles, le ballet des opérateurs qui replacent prestement les caméras, suivis par les techniciens chargés de dégager les câbles. Ces mouvements multiples et apparemment désordonnés mettent en évidence une formidable réactivité, seule manière de mettre en oeuvre ensemble un projet commun dont la réussite dépendra, comme pour les musiciens de l’orchestre, de l’engagement de chacun.

Les deux séquences exaltent les progrès techniques qui répondent en partie aux désirs de cinéma de Renoir et de Rozier. Pour le premier, la maniabilité et la vérité du son direct, la rapidité de la diffusion de l’information par les moyens de la radio. Pour le second, la vitesse et la réactivité des tournages à plusieurs caméras devenus possibles grâce à la télévision. Deux manières de commencer un film en révélant avec une certaine jubilation comment la technique permet de saisir l’instant, de capter le présent. Entre les deux films, vingt-trois années ont passé : si le reportage de Renoir sur la radio est une reconstitution, un direct simulé, celui de Rozier est une véritable captation dans les conditions du direct de Jazz Memories, émission de télévision qui a lieu pendant le tournage. Rozier (cité dans Mouëllic 2006, p. 65-66), qui a été assistant à la télévision, avouera bien plus tard avoir voulu « s’inspirer à la fois de Renoir et de la télévision en direct » avant de poursuivre :

Donc j’ai tourné Adieu Philippine comme ça, avec deux caméras. Cela me permettait d’éviter les ruptures dans le tournage d’une séquence, de tourner en continuité et donc de laisser une grande liberté d’improvisation aux comédiens [5].

Le même « désir de direct » rassemble ici Renoir et Rozier, « désir de direct » qui est tout autant un « appétit documentaire », une volonté de saisir la vie là où elle se passe. Pourtant, le problème du son direct n’est toujours pas résolu : si Rozier est sans doute le seul, au début des années 1960, à prendre au mot la plupart des principes affirmés avec force par les cinéastes de la Nouvelle Vague, il ne tourne pas pour autant Adieu Philippine en son direct. La vitalité des nombreuses séquences improvisées tournées en extérieur, véritables célébrations de la jeunesse et de la liberté des corps [6], n’aurait guère supporté les contraintes techniques liées au son direct. Mais le premier long métrage de Rozier témoigne, s’il en est besoin, d’un désir désormais assumé d’inventer des fictions au coeur même de la réalité, désir qui ne peut se satisfaire de la postsynchronisation. Dans Du côté d’Orouët (1973), son deuxième long métrage, Rozier partira à plusieurs reprises du son direct pour monter les séquences improvisées : la vivacité du son passera alors, j’y reviendrai, avant la logique d’enchaînement des images.

3. Une esthétique du direct

Cette évocation des rapports des séquences d’ouverture de La règle du jeu et d’Adieu Philippine avec la radio et le direct télévisuel permet de comprendre les débats qui ont accompagné l’arrivée de la télévision dans les années 1950, débats qui n’ont pas manqué de concerner tout autant le cinéma. Avec l’avènement de la télévision, les conditions du direct telles qu’elles étaient mises en scène par Renoir vont peu à peu devenir réalité. Dans plusieurs de ses analyses, Gilles Delavaud montre combien cette question du direct a été centrale dans les échanges consacrés à la télévision qu’il définit triplement, à partir de quelques textes d’André Bazin, comme « art du direct », « art de la présence » et « art de l’intimité ». C’est bien la captation simultanée du son et des images qui permet cette sensation d’un « événement en train de se passer sous nos yeux », c’est bien l’enregistrement dans les conditions du direct qui donne ce sentiment de présence. Dans le même texte, intitulé sobrement « André Bazin, critique de télévision », Delavaud (2003) cite à plusieurs reprises le critique pour retenir son intérêt pour le direct télévisuel, intérêt qui s’accompagne, dans des articles de 1957 notamment, d’une prise de distance avec « le direct pur » ou « l’obsession formaliste du direct » (Radio-cinéma, 6 août 1957), pour retenir plutôt « l’esprit, le style, le ton du direct » (Radio-cinéma, 3 juillet 1957), ce qui permet à Delavaud (2003, p. 55-56) de conclure que

l’esthétique du direct (et non le direct lui-même), dans la mesure où elle traduit une exigence nouvelle de réalisme, est désormais, pour Bazin, ce qui définit le mieux l’art de la télévision.

Le même Delavaud (p. 73) éclaircira en 2007 cette esthétique du direct dans un article de Cinémas intitulé « Penser la télévision avec le cinéma », article qu’il résume brièvement ainsi avant d’en développer chacune des idées :

S’émanciper du modèle film a amené les observateurs de la télévision naissante ainsi que les premiers réalisateurs à reconsidérer la relation entre continu et discontinu, à repenser la fonction du découpage, à expérimenter de nouvelles formes de réglage entre le son et l’image, à redéfinir la notion de montage. La réflexion autour de ces différentes questions a été, pendant la première décennie de la télévision, en grande partie déterminée par les impératifs de la transmission en direct.

4. Le jazz comme performance

Pour comprendre l’intérêt de Bazin pour cette esthétique du direct, il suffit de redécouvrir par exemple quelques images d’une retransmission d’un concert du quartet de John Coltrane enregistré par la télévision belge à Comblain-la-Tour le 1^er août 1965, moment de direct « pur » dont l’effet de présence reste aujourd’hui tout à fait saisissant. Laissons le cinéaste Johan van der Keuken (van der Keuken et Albera 1998, p. 11) commenter cette performance :

Je reste fasciné par l’information incomplète et floue […]. Je pense à l’émotion intense qui nous a saisis à la projection d’une copie de film, d’une bande vidéo, d’une émission de télévision où l’on voyait et entendait John Coltrane, Elvin Jones, Jimmy Garrison et McCoy Tyner : image vague, presque engloutie par le brouillage. C’est l’expérience la plus directe qui reste encore de ce quatuor et par là, l’expérience la plus directe qu’on puisse imaginer.

L’intensité louée par van der Keuken naît de cette performance jouée par quatre musiciens et enregistrée avec plusieurs caméras et des micros devant les instruments. Le son est probablement celui de la sonorisation du concert, mixé en direct par les techniciens. Cette captation en extérieur et en son direct existe alors depuis quelques années [7], et on ne peut que constater ici avec van der Keuken la puissance de ces images. Le dispositif est donc celui du concert, et ce direct son/image n’est possible qu’avec cette configuration spécifique dans laquelle il importe peu que les « acteurs » n’aient pas de liberté de mouvement, comme il importe peu que les micros soient parfaitement visibles. La véritable nouveauté réside dans la captation en direct de ce que l’on peut appeler ici sans réserve un événement visuel et sonore. Le jazz, musique dans laquelle le temps de création est aussi celui de la performance, a ainsi été sans aucun doute la musique de la première télévision : que ce soit aux États-Unis, en Angleterre ou en France, les émissions de studio consacrées au jazz sont légion. La plus représentative est The Sound of Jazz, créée en 1957 pour la CBS par le producteur Robert Herridge, avec la collaboration du critique de jazz Nat Hentoff. The Sound of Jazz a servi de modèle à plusieurs émissions, comme Jazz Scene U.S.A. (1962) de Steve Allen, Jazz Casual (1959) de Ralph J. Gleason ou encore, quelques années plus tard, à l’émission de la BBC Jazz 625 (1964-1966), présentée en public par Humphrey Lyttelton. La mise en scène est toujours sensiblement la même : sous le regard de quelques rares spectateurs disséminés autour du plateau, un animateur se contente de présenter en quelques minutes le groupe et les morceaux, dans un décor très sobre où l’on découvre les caméras, les projecteurs et le matériel d’enregistrement sonore. Le spectacle, c’est la musique et rien d’autre : les musiciens ne sont plus des entertainers mais des artistes à part entière.

Certaines des expériences les plus novatrices du début des années 1960 prendront explicitement modèle sur le jazz pour tenter d’approcher cette immédiateté, incluant même de véritables musiciens dans la mise en scène. C’est le cas par exemple de The Connection (1962), de Shirley Clarke, adaptation d’une pièce de Jack Gelber créée en 1959 à New York par le Living Theatre de Julian Beck et Judith Malina. Quelques junkies, parmi lesquels quatre musiciens de jazz, attendent leur connection, leur dealer nommé Cowboy. Cette attente d’une nuit est filmée par une équipe de télévision, et ce sont ces images que les spectateurs du film sont censés découvrir. Ce qui m’intéresse, ici, c’est la présence, une fois encore, de la technique et de l’immédiateté supposée de la captation du son et des images. Mais les seules improvisations réelles sont celles des jazzmen, tout le reste de la pièce comme du film étant écrit et parfaitement déterminé. On a bien, une fois encore, une mise en scène de la technique, avec une simulation de captation influencée par le reportage. Mais ce qui se joue aussi dans cette simulation de l’enregistrement d’un événement dans sa continuité, c’est la question du temps, de la durée nécessaire à l’improvisation. L’exemple du jazz est à nouveau très précieux. On sait en effet l’importance historique pour l’évolution de l’improvisation dans le jazz de la naissance des disques 33 tours, format qui s’est imposé dans les années 1950. Les musiciens ont pu enfin, dans le cadre d’un enregistrement, s’exprimer sans limite de temps ou presque. À la fin de cette décennie, Miles Davis utilisera cette liberté pour inventer un style où le silence joue un rôle considérable [8], tandis que John Coltrane, à la suite d’Ornette Coleman et des tenants du free jazz, travaillera au contraire à la saturation de l’univers sonore. Il n’est donc pas surprenant qu’au même moment des cinéastes affirment haut et fort la nécessité de pouvoir enregistrer des images dans la durée et en son direct, la nécessité de pouvoir à leur tour faire confiance au temps pour inventer des formes nouvelles.

5. La parole comme « son du corps »

Mais en dehors de l’agencement spécifique du concert, un dispositif permettant le filmage en son direct est difficilement applicable au cinéma, qu’il soit documentaire ou de fiction, surtout si l’on ne souhaite pas réduire considérablement le mouvement des acteurs. Les cinéastes sont pourtant nombreux à faire référence aux potentialités du direct issues de la télévision : Truffaut, bien sûr, dans la fameuse séquence de l’entretien du jeune Jean-Pierre Léaud avec la psychologue à la fin des Quatre cents coups (1959) ; Rozier, on l’a vu, dans le générique de son premier long métrage ; mais aussi, et d’une tout autre manière, Jean Rouch, qui, comme l’a bien analysé Séverine Graff [9], invente avec Moi, un Noir (1958) des dispositifs susceptibles de retrouver la vitalité du direct : la séquence du travelling avec la voix improvisée par l’acteur sur les images en est un parfait exemple, dans lequel Rouch, tout en appliquant avec brio la non-coïncidence chère au Eisenstein théoricien, montre son impatience devant cette technique qui ne parvient pas encore à restituer ensemble avec précision les bruits et les mouvements du monde. Séverine Graff est très claire sur ce point dans son texte consacré à Rouch, où elle note avec justesse les difficultés majeures liées à l’absence de synchronisme entre les appareils d’enregistrement des images et du son, liées aussi aux bruits des caméras et au poids des magnétophones Nagra conçus pour la radio et peu compatibles avec les déplacements des comédiens contraints au mieux de porter un appareil de cinq kilos. Chaque spectateur de Chronique d’un été (Edgar Morin et Jean Rouch, 1961) se souvient de la séquence où Marceline Loridan marche dans Paris, place de la Concorde puis Gare de Lyon, en évoquant sa propre déportation et le souvenir douloureux de sa mère disparue dans les camps de la mort. Le cadrage en plan large du début rend a priori impossible l’enregistrement du son direct et le synchronisme assez approximatif semble confirmer la postsynchronisation. Mais un examen attentif de la jeune femme permet de deviner une forme étrange qui semble gonfler son imperméable dans son dos. Il s’agit en fait d’un magnétophone Nagra qu’elle parvient presque à dissimuler. À chacune de ses paroles, Marceline Loridan penche légèrement son visage vers le bas pour parler au plus près du micro caché lui aussi sous ses vêtements. La synchronisation imparfaite est due aux difficultés rencontrées au montage pour caler les paroles sur le mouvement des lèvres, sons et images étant enregistrés séparément, sans connexion entre la caméra et le magnétophone. Dans le deuxième plan de la séquence, filmé en contre-plongée très près du visage, le mouvement du visage vers le micro est toujours très visible, avant que le troisième et ultime plan, ce fameux travelling arrière de plus en plus large filmé sous la halle de la Gare de Lyon, ne vienne rassembler un plan très large et la parole en direct. Cette succession de trois plans d’échelle différente est une forme de mise en scène de ce besoin de filmer ensemble, dans la rue, un corps en mouvement et la parole libre comme son de ce corps. On sait maintenant que, dans le dernier plan, le sac fort lourd que Marceline Loridan porte au bout de son bras gauche contient le magnétophone Nagra qui permet d’enregistrer sa voix dans le temps même du plan. On est donc toujours dans un dispositif très contraignant, mais Chronique d’un été témoigne de ce désir décidément impérieux de libérer la parole et de cette conscience de l’importance, pour y arriver, de libérer le corps.

Ce n’est pas pour rien, bien sûr, si cette tentative acharnée pour parvenir à maîtriser le son direct émane de Jean Rouch et d’Edgar Morin, un ethnologue et un sociologue, au moment où la sociologie vit des bouleversements importants que Morin (1984) théorisera plus tard sous l’expression sociologie du présent. La méthode affichée dans Chronique d’un été, où Nadine Ballot et Marceline Loridan arpentent les rues de Paris pour braquer un micro devant les passants et leur demander simplement « êtes-vous heureux ? », ce dispositif où l’on voit Rouch et Morin échanger devant les caméras à propos du film qu’ils sont en train de faire, où l’on invite les protagonistes à venir réagir devant le film achevé, cette méthode est tout entière tournée vers la possibilité de l’improvisation et de ce qui apparaît comme son nécessaire corrélat : la parole libre, donc le son direct synchrone. Sans doute reste-t-il un travail important à faire sur ces années 1960, où la question du son est un élément essentiel des expérimentations menées par les cinéastes, en lien notamment avec le Service de la recherche de la l’Office de la radiodiffusion-télévision française (RTF), dirigé alors par Pierre Schaeffer. Si l’on sait aujourd’hui l’importance de ce service dans la réalisation de plusieurs films majeurs (avec La jetée [1962] de Chris Marker comme formidable « vitrine »), l’émulation qui régnait alors autour du Service de la recherche, où technique et esthétique étaient pensées ensemble et où l’on portait une attention singulière à la dimension sonore, mérite sans aucun doute d’être bien plus concrètement prise en compte [10]. Dans son essai intitulé Pour un cinéma léger et synchrone (2012), consacré au chemin semé d’embûches suivi par quelques cinéastes et techniciens de l’Office national du film du Canada pour inventer un dispositif permettant d’être au plus près de la réalité des choses, Vincent Bouchard montre combien, des deux côtés de l’Atlantique, le désir de direct rassemble des francs-tireurs aussi ingénieux que tenaces. Toutes les tentatives convergent vers cette possibilité d’être enfin « au milieu de la partie de cartes », comme le dit fort joliment l’ingénieur du son Marcel Carrière (cité dans Bouchard 2012, p. 150), et de pouvoir instaurer des liens nouveaux et bien plus immédiats avec les personnes filmées. Le temps n’est pas encore venu où la légèreté du matériel et la fiabilité du son permettront une liberté réelle dans l’espace et dans le temps, deux conditions essentielles pour envisager une véritable improvisation, mais la télévision a montré le chemin, et les innovations des décennies suivantes vont peu à peu répondre aux attentes des cinéastes.

6. Généraliser le son direct

J’ai décrit ailleurs [11] les multiples expériences qui vont ponctuer les années 1960, 1970 et 1980 afin de parvenir à libérer le cinéma des contraintes techniques, expériences menées aussi bien dans la fiction que dans le documentaire par Cassavetes, Pialat, Rozier, Rouch ou van der Keuken. Jacques Rivette est peut-être celui qui a été le plus loin dans cette direction en n’hésitant pas, dans Noroît (1976), à enregistrer en direct les dialogues des comédiens et une musique improvisée elle aussi en direct, contraignant l’ingénieur du son Pierre Gamet à mixer pendant la prise, sans possibilité d’y revenir au montage [12]. La séquence d’ouverture du film est sans doute un cas extrême, qui marque cette volonté de direct et démontre les difficultés liées à la prise de son dans un environnement défavorable. On y voit une jeune femme, Morag (Geraldine Chaplin), tout au bord d’une mer raisonnablement agitée, allongée près du cadavre de son frère Shane dont elle déplore la mort et annonce la vengeance dans un monologue devenu en grande partie inaudible à cause du bruit des vagues. Cette séquence, vécue comme un véritable cauchemar par Pierre Gamet, alors tout jeune ingénieur du son, est une des traces du véritable mysticisme du son direct de Rivette, contraint après plusieurs projections d’ajouter des sous-titres. Il avait réalisé quelques années plus tôt L’amour fou (1969), un de ses films les plus improvisés où il met en scène à son tour la technique en filmant l’équipe de télévision d’André S. Labarthe tournant en 16 mm un documentaire sur les répétitions d’une troupe de théâtre. Le dispositif est ici parfaitement visible, avec le preneur de son, son magnétophone en bandoulière, contraint de suivre le déplacement du caméraman, 16 mm à l’épaule, auquel il est attaché par le câble de connexion magnétophone/caméra. C’est encore le son de la voix qui est au coeur de la prise, voix des acteurs répétant Andromaque de Racine dans le vaste espace d’un gymnase, voix du metteur en scène, joué par Jean-Pierre Kalfon, dirigeant à l’intonation près ses comédiens. L’improvisation ne concerne pas le jeu des acteurs, mais l’équipe technique, dont Rivette célèbre ici la liberté de mouvement, sans ignorer les contraintes imposées par la dépendance entre l’appareil d’enregistrement et la caméra. Mais il s’agit bien de capter une création en marche, et c’est dans l’appartement du metteur en scène et de sa compagne actrice (Bulle Ogier), les deux personnages principaux, que Rivette mettra en scène avec la complicité de ses comédiens une forme de happening improvisé qu’il conclura par la destruction du décor de l’appartement [13]. Si toutes les séquences sont ici en son direct, peu sont filmées en extérieur ou dans un environnement bruyant : quelle que soit la radicalité de l’improvisation de Rivette, nous sommes encore à l’abri de la bruyante agitation du monde.

On retrouve dans Nashville (1975) de Robert Altman, film contemporain du Noroît de Rivette, une même volonté de mettre le son au coeur de la création cinématographique. Dans une étude lumineuse parue en 1991 dans Cinémas [14], Rick Altman émet l’hypothèse que le choix de faire se croiser vingt-quatre personnages dans Nashville constitue une forme d’hommage à la technique de l’enregistrement en vingt-quatre pistes qui, au début des années 1970, s’est imposée comme un standard dans les studios de l’industrie du disque. Avec l’aide de l’ingénieur du son Jim Webb, Altman renouvelle les possibilités sonores du cinéma en enregistrant avec plusieurs caméras et plusieurs micros des événements simultanés, dans un ou plusieurs lieux. Grâce à un travail de mixage proche de celui d’un studio d’enregistrement, dont on découvre les possibilités dès la première séquence du film, Altman et Webb choisissent ensuite de privilégier tel ou tel son, de donner du relief ou non à tel bruit, de faire se chevaucher plusieurs voix, obligeant ainsi le spectateur à sélectionner lui-même l’une ou l’autre des sources. Cette technique confère également une part de liberté aux comédiens, les possibilités du mixage permettant, si besoin est, de faire disparaître une improvisation inappropriée. Tout en reconnaissant la dimension novatrice des expériences du cinéaste, Rick Altman note cependant que si la sensation d’improvisation résulte bien de la diversité d’événements sonores simultanés, il ne s’agit là que d’une sensation tant la part de préméditation est d’évidence tout à fait impérieuse, certaines séquences sonores étant même totalement reconstituées en studio. Le talent de Robert Altman est alors de donner à entendre le désordre indescriptible et insaisissable de la réalité du monde grâce à une maîtrise exceptionnelle autant de la mise en scène que des moyens techniques dont il contribue ici grandement à renouveler les usages. Si, par la multiplication des pistes isolées les unes des autres, Altman semble résoudre le problème rencontré par Rivette sur le tournage improvisé de Noroît, il garde, lui, le contrôle sur chaque élément de représentation tout en donnant à son film les apparences d’une succession d’événements proches du documentaire. Ce constat n’enlève rien à la richesse de Nashville, tout en situant Altman bien plus du côté des cinéastes « démiurges » comme Welles ou Godard que des expérimentateurs comme Rivette ou Rozier, ce qui, au regard du reste de son oeuvre, n’est guère surprenant.

7. Monter par le son

C’est de nouveau Rozier qui éprouvera la création improvisée en donnant au son une place essentielle dans des dispositifs dont l’audace ne cesse de surprendre encore aujourd’hui. Avec Du côté d’Orouët, film réalisé en 1969 (l’année de sortie de L’amour fou) et 1970, mais qui ne sera distribué qu’en septembre 1973, il prend tous les risques en tournant une séquence essentielle sur un petit dériveur, avec à son bord un moniteur de voile rencontré sur les lieux du tournage et deux des jeunes héroïnes du film, actrices inexpérimentées. La séquence est filmée en son direct, avec deux caméras 16 mm, les opérateurs (dont Rozier lui-même) étant parfois sur un second dériveur, d’autres fois sur le même bateau que les acteurs. Cette situation très précaire ne manque pas de provoquer des réactions très spontanées des comédiennes, confrontées à leur première expérience de la voile, leur ami marin faisant spectaculairement gîter le bateau. Mais bien plus que les images, c’est le son qui donne à voir autant qu’à entendre l’énergie vitale qui se dégage de la séquence : les cris des jeunes filles, le bruit incessant des vagues, les ordres du jeune moniteur de voile, la précipitation des manoeuvres incertaines pour virer de bord. Pendant la durée des prises, improvisées sans aucune indication de jeu ou de dialogues, toute l’équipe est obligée de se soumettre aux caprices de la mer, obligée de vivre l’instant sans autre projet que de continuer à jouer et à filmer sans tomber à l’eau. La réussite de la séquence tient à un parti pris radical de Rozier au moment du montage : il décide de ne tenir compte dans un premier temps que du son direct et de créer une continuité sonore à partir des seuls enregistrements. Ce n’est qu’une fois ce travail effectué qu’il monte les images destinées à illustrer le son. Inutile de préciser que les soucis de raccords de mouvement ou de lumière sont ignorés au profit d’une succession d’instants sonores et visuels composés avec la même liberté qu’une improvisation de jazz. Rozier invente alors une autre forme de cinéma, aussi éloignée du geste de compositeur de Godard que de tout fétichisme du son direct comme complément indispensable à la vérité des images. Sans autre ambition que de rendre compte de la beauté d’un pur présent, Rozier donne la primauté au son direct sur l’image et fait exister de nouveaux rapports entre vision et audition, manière inattendue de continuer à explorer cette non-coïncidence décidément féconde. Bien des années plus tard, Pascale Ferran adoptera le même principe de montage par le son quand elle filmera, quatre jours durant, l’enregistrement d’un disque du duo formé par le pianiste Tony Hymas et le saxophoniste Sam Rivers, enfermés dans un studio à Ocoee, en Floride. Quatre jours à Ocoee (2001) est un film sur le jazz et le cinéma comme créations collectives improvisées qui montre combien il s’agit là d’aventures aussi exaltantes que difficiles.

Les années 1970 verront l’apparition des premières caméras 35 mm silencieuses et maniables. Alain Cavalier (2004), dont on connaît le goût pour un matériel léger qui lui permet de faire aujourd’hui des films avec une totale autonomie, condamnait depuis bien longtemps la postsynchronisation, ce moment où, disait-il, « le son rejoint enfin le corps et [où] c’est trop tard : on ne sépare pas ce que la nature unit ». Il se réjouira donc de disposer en 1976 pour Le plein de super, film partiellement improvisé, d’une nouvelle caméra Panavision :

Elle est compacte, silencieuse, on peut la porter à l’épaule. Image et son, même rapidité d’exécution. Tournage souple, alerte. C’est comme si l’oeil de l’opérateur et l’oreille de l’ingénieur du son étaient les miens. Impression de dénicher pour longtemps une vraie machine à saisir la vie avant qu’elle ne s’envole, se fige ou me frappe
Cavalier 2004

Le dispositif du film est tout entier lié à cette technique qui permet enfin de tourner des fictions avec une équipe réduite au minimum :

Le plein de super, c’est une Chevrolet, une station-wagon des années soixante-dix. Choisie pour qu’on puisse entasser les quatre acteurs, l’ingénieur du son, le cameraman et le réalisateur. Pas de lampe. Des draps blancs sur les genoux éclairent les visages. Des milliers de kilomètres d’autoroute pour filmer l’amitié violente ou joyeuse [15].

Cette traversée de la France, de Lille à la Méditerranée, improvisée par Cavalier et son quatuor de comédiens (Patrick Bouchitey, Étienne Chicot, Bernard Crombey et Xavier Saint-Macary), est le film le plus emblématique de ce moment où la possibilité existe enfin de se libérer des contraintes de la technique pour « crier fort qu’on est vivant », comme l’écrit Cavalier (2004), et continuer ainsi à inventer cette esthétique du direct chère à André Bazin. Comme si le cinéma avait pris le meilleur des possibilités nées d’une télévision qui, si elle a su rester marginalement créative (avec le Service de la recherche de la RTF [Office de Radiodiffusion-télévision française], par exemple), n’a guère répondu aux espoirs suscités par ses premières années d’existence. Plus de cinquante ans après l’avènement de la télévision, les techniques numériques font naître à leur tour de nouvelles possibilités de filmage et d’enregistrement du son. Les micros haute fréquence et les magnétophones numériques multipistes comme le Cantar, inventé en 2002 par Jean-Pierre Beauviala et les ingénieurs de sa société Aaton, suscitent d’autres envies de mises en scène dans lesquelles l’improvisation peut jouer un rôle non négligeable. Ce sera l’objet d’une nouvelle étude parmi les chantiers nombreux qui restent à ouvrir pour continuer à mettre au jour l’importance, en grande partie ignorée, de la dimension sonore dans l’invention et le renouvellement des formes cinématographiques [16].

Improvisation et son direct. Entre théories du son et mutations technologiquesImprovisation and Direct Sound: Sound Theories and Technological Change

Résumé

Abstract

1. Non-coïncidence

2. Renoir et Rozier

3. Une esthétique du direct

4. Le jazz comme performance

5. La parole comme « son du corps »

6. Généraliser le son direct

7. Monter par le son

Note biographique

Notes

Bibliographie

Résumés

Résumé

Abstract

Corps de l’article

1. Non-coïncidence

2. Renoir et Rozier

3. Une esthétique du direct

4. Le jazz comme performance

5. La parole comme « son du corps »

6. Généraliser le son direct

7. Monter par le son

Parties annexes

Note biographique

Notes

Bibliographie

Outils de citation

Citer cet article

Exporter la notice de cet article