Nous sommes tous nés polyglottes — Alfred Tomatis

« On ne reproduit que les sons qu’on sait écouter. C’est la loi fondamentale. »

En bref — Pourquoi un Allemand parle-t-il si bien français, et un Français si mal anglais ? Pourquoi l’anglais compte-t-il 360 000 mots et l’espagnol à peine 45 000 ? Pour Alfred Tomatis, tout se joue dans l’oreille. Sa thèse, provocante et tendre à la fois : nous naissons tous polyglottes, capables de toutes les langues — car elles sont toutes nées d’une même oreille, simplement plongée dans des « bains » sonores différents. Si l’adulte bute, ce n’est ni par paresse ni par manque de don : c’est que son oreille s’est resserrée sur la musique de sa langue maternelle. Reste à la rouvrir. À l’appui, un colosse à la voix retrouvée — Gérard Depardieu — et des élèves qui racontent l’anglais qui « rentre tout seul ».

Les points clés

Nous naissons tous polyglottes : toutes les langues dérivent d’une même oreille, façonnée ensuite par le « milieu » acoustique où elle baigne.
La loi fondamentale : « on ne reproduit que les sons qu’on sait écouter » — on ne peut prononcer que ce qu’on entend vraiment.
Chaque langue a sa bande de fréquences : le français, resserré et « sclérosé » entre 1000 et 2000 Hz ; l’anglais, aigu, sifflé, diphtongué (d’où ses 360 000 mots) ; l’espagnol, pur ; l’allemand, ouvert sur plusieurs octaves — d’où son aisance.
L’oreille est la dynamo du cerveau : sa grande fonction est de lui fournir de la stimulation.
Réapprendre par « l’oreille de l’utérus » : en filtrant une langue comme l’entendrait un fœtus, il n’en reste que la musique — et le cerveau l’intègre avant même d’en comprendre les mots.
La preuve par la voix : Tomatis a « sorti » la voix d’un jeune colosse muet de timidité — Gérard Depardieu — avant ses rôles de Cyrano et de Christophe Colomb.

Une seule oreille à l’origine

La thèse tient en une phrase : « Nous sommes nés tous polyglottes, et ce qui me le fait dire, c’est que toutes les langues, qui ont pourtant dégénéré par la suite, sont nées d’une même oreille au départ. » Cette oreille unique, en se trouvant « plongée dans des milieux différents — des impédances différentes, des résistances différentes », a donné naissance à la diversité des langues. Mais, ajoute Tomatis, « une oreille est toujours adaptable pour retrouver ses potentialités ». Autrement dit : la fermeture n’est pas une fatalité.

Au passage, une étincelle d’anthropologie tomatisienne : ce n’est pas la station debout qui nous a fait parler, mais l’inverse. « Je crois que c’est parce qu’il a été obligé de parler que l’homme s’est mis debout. » L’humain, dit-il, « passe du manger à la parole — ce qui n’est pas rien ».

« On ne reproduit que les sons qu’on sait écouter »

C’est la clé de voûte, qu’il appelle la loi fondamentale. On ne peut émettre que ce qu’on entend : la voix est prisonnière de l’oreille. De là deux corollaires qu’il pose comme un théorème : si l’on modifie l’audition, on modifie la voix ; et réciproquement, « si la voix devient bonne, l’oreille se modifie ». Voix et oreille forment une boucle — toucher à l’une, c’est agir sur l’autre.

L’exemple est savoureux : transplantez au Québec des gens dont la langue ignore la nasalité ; en peu de temps, « ils parlent du nez », comme l’air du pays. « Le Canada vibre à 1500 Hz » — et l’oreille s’y conforme.

Chaque langue, une bande de fréquences

C’est ici que Tomatis devient le plus concret — et le plus drôle. Chaque langue occuperait une fenêtre sonore propre, qui sculpte ses sons, son vocabulaire, jusqu’au corps de ses locuteurs.

Le français « vibre » dans une bande étroite, entre 1000 et 2000 Hz, qui « sclérose » l’oreille française : confortable, mais fermée — d’où la difficulté à élargir l’écoute et donc à apprendre. Avec 65 000 mots, « ça lui suffit ». L’anglais, lui, « siffle » : ouvert de 2000 à 15 000 Hz, tout y est diphtongué, étiré, éloigné de l’écrit — d’où ses 360 000 mots. L’espagnol, « de Cervantes », sans diphtongue ni distorsion, reste pur avec ses 45 000 mots : « une langue se déforme d’autant plus qu’elle est tirée vers les aigus. » Quant à l’allemand, « beaucoup plus établi », ouvert sur plusieurs octaves et doté d’un temps d’analyse plus long, il rend ses locuteurs « plus en rectitude, plus ouverts » — et plus doués pour les langues. « Quand on va en Allemagne, on est surpris de voir que tous les Allemands parlent déjà très bien le français. »

Et derrière les fréquences, toujours la même idée : « la grande fonction de l’oreille, c’est de donner au cerveau beaucoup de stimulation. »

Réapprendre par l’oreille de l’utérus

Comment rouvrir une oreille fermée ? Tomatis a eu une intuition : l’oreille « entend parfaitement dans l’utérus » — pourquoi ne pas faire « bénéficier de ce cursus utérin » l’apprentissage d’une langue ? En filtrant une langue comme l’entendrait un fœtus, « il ne reste que la musique de la langue ». Et cette musique, dit-il, est déjà « neurologiquement » tout le système : « le sujet, même ne comprenant rien, a déjà le champ de la langue. »

Les témoignages d’élèves, dans le film, disent la même expérience en mots simples : l’anglais d’un film qui « rentre tout seul, sans y prêter attention » ; le besoin de monter le volume qui s’efface ; les versions originales que l’on « ressent » même sans tout comprendre. L’un résume : « comme un daltonien qui, d’un coup, verrait toutes les couleurs. » Beaucoup notent aussi le rôle de la posture — se tenir « plus droit » pour entrer dans l’anglais — et le caractère passif de la méthode, qu’on suit en lisant son courrier.

Le colosse à la voix retrouvée

La plus belle preuve, Tomatis la garde pour la fin, et c’est une histoire vraie. Un jeune homme « de 17 ans, ce colosse que vous connaissez », si bloqué qu’« il ne pouvait rien dire ». Tomatis lui « sort la voix » — et le muet timide devient l’une des plus grandes voix du cinéma français : Gérard Depardieu, bientôt Cyrano (« c’est un roc, c’est un pic, c’est un cap… »), puis Christophe Colomb. « Parler plusieurs langues, conclut Tomatis, c’est un bénéfice : c’est plusieurs mentalités. » Et de rêver, avec le linguiste Troubetzkoy, d’en parler cent vingt : « là, on serait tranquille. »

Aujourd’hui : ce que dit la science

Comme souvent chez Tomatis, il faut séparer la prémisse de la solution. La prémisse — nous naissons capables de toutes les langues, et l’oreille se referme ensuite sur la maternelle — est aujourd’hui l’une des idées les mieux établies des sciences du langage. La solution — rouvrir l’oreille adulte par l’écoute passive d’une langue « filtrée » — reste, elle, non démontrée. Dire l’une sans l’autre serait malhonnête ; les tenir ensemble, c’est rendre justice à l’intuition tout en restant lucide.

« Nés polyglottes » — confirmé. Le nourrisson est bien un auditeur universel : à 6-8 mois, un bébé distingue des consonnes de langues qu’il n’a jamais entendues ; vers 10-12 mois, cette capacité s’efface au profit des sons de sa langue (les travaux fondateurs de Werker & Tees, puis l’« aimant phonémique » de Patricia Kuhl, avec le fameux r/l que les bébés japonais cessent de discriminer). Tomatis appelait cela une oreille qui « se sclérose » ; on parle aujourd’hui de réorganisation perceptive. Nuance plus fine — et plutôt favorable à son optimisme : ce n’est pas une perte définitive mais une spécialisation réversible, sensible au lien social. Des bébés américains réexposés au mandarin par un locuteur vivant (et non par une vidéo) récupèrent la discrimination perdue.

Tout commence avant la naissance — confirmé. Tomatis insistait sur « l’oreille de l’utérus », qui n’entend que la musique de la langue. La science lui donne raison : les nouveau-nés français pleurent avec une mélodie montante, les allemands avec une mélodie descendante — la prosodie entendue in utero façonne déjà les premiers cris. Dès quatre jours, le bébé distingue sa langue maternelle d’une langue étrangère. Précision importante : ce qui s’apprend avant la naissance est surtout le rythme et la mélodie (l’utérus agit comme un filtre passe-bas — détail qui rejoint, ironie, l’intérêt de Tomatis pour le filtrage des fréquences) ; les phonèmes, les mots et la grammaire, eux, s’acquièrent après.

« Sourd » à l’anglais — confirmé, et c’est réparable. L’adulte assimile les sons étrangers à ses catégories natives : c’est le « crible phonologique » que Tomatis décrivait à sa façon. Mais — point capital — les modèles actuels (Flege, Best) montrent que les mécanismes d’apprentissage restent intacts toute la vie : l’oreille adulte n’est pas une fenêtre close, elle manque surtout d’entraînement. Et l’on sait aujourd’hui ce qui la rééduque : non pas l’écoute passive de musique filtrée, mais l’entraînement perceptif actif à voix multiples (le High-Variability Phonetic Training), dont les méta-analyses confirment l’efficacité — au point d’améliorer même la prononciation sans jamais la travailler. L’intuition de Tomatis (« on apprend par l’oreille, et l’oreille se rééduque ») était juste ; c’est le moyen qui a changé.

Le « cerveau bilingue » — à relativiser. Tomatis vantait le multilinguisme comme « plusieurs mentalités ». Sur le plan culturel et humain, rien à redire. Mais le fameux « avantage exécutif » du bilingue, popularisé par la presse, est aujourd’hui largement contesté : après correction des biais de publication, les méta-analyses ne le retrouvent pas chez l’adulte sain, et l’on ne mesure pas de différence cérébrale robuste. Ce qui résiste mieux : une conscience métalinguistique plus fine chez l’enfant, et surtout un retard de l’apparition des symptômes de démence (de l’ordre de 4 à 5 ans) — un délai, pas une prévention. Le multilinguisme reste précieux ; le « super-cerveau » bilingue, lui, relève du mythe.

Oreille musicale et langues. Le lien que pressentait Tomatis (entre l’oreille du musicien et le don des langues) existe — mais c’est surtout une corrélation, forte pour les sons (accent, perception des tons), faible pour la grammaire. En revanche, l’idée que « faire de la musique » améliorerait mécaniquement l’apprentissage des langues n’est pas établie : oreille musicale et talent pour les sons étrangers vont ensemble sans que l’un cause l’autre.

Et la méthode ? Ici, la prudence s’impose. Les évaluations indépendantes sont négatives ou neutres (revue Cochrane ; essai randomisé Corbett 2008 sans bénéfice ; position de l’ASHA), et pour l’apprentissage des langues spécifiquement, il n’existe aucune preuve contrôlée robuste. L’« oreille électronique » qui rouvrirait l’oreille adulte par filtrage reste une hypothèse non validée — Tomatis lui-même, dit-on, regrettait de n’avoir pas fourni davantage de preuves. Le film vaut donc d’abord comme pensée : une intuition juste de l’oreille comme porte d’entrée du langage.

Au goût du jour. Reste l’essentiel, et il est d’une actualité brûlante. On apprend les langues à l’ère des applications et de l’IA, et la recherche confirme qu’il n’y a pas de « falaise » : l’aptitude reste élevée jusque vers 17 ans puis décline en douceur — autrement dit, il n’est jamais trop tard, mais commencer tôt aide. Et surtout : préserver l’oreille n’a jamais été aussi urgent. L’OMS estime que plus d’un milliard de jeunes de 12 à 35 ans risquent une perte auditive évitable par une écoute à risque, et prévoit 2,5 milliards de personnes touchées d’ici 2050. « Nous sommes tous nés polyglottes » — encore faut-il préserver l’instrument qui nous l’a permis.

Sources

L’auditeur universel & la spécialisation — Cross-language speech perception: perceptual reorganization during the first year of life, Werker & Tees, 1984 : pubmed · A new view of language acquisition, Kuhl, PNAS 2000 : pubmed · Brain mechanisms in early language acquisition, Kuhl, Neuron 2010 : pubmed · réversibilité par locuteur vivant, Kuhl, Tsao & Liu, PNAS 2003 : pubmed
Apprentissage prénatal & prosodie — Newborns’ cry melody is shaped by their native language, Mampe et al., Current Biology 2009 : pubmed · A precursor of language acquisition in young infants, Mehler et al., Cognition 1988 : pubmed · Statistical learning by 8-month-old infants, Saffran et al., Science 1996 : pubmed
L’oreille adulte se rééduque — The revised Speech Learning Model, Flege & Bohn, 2021 · HVPT: a meta-analysis, Uchihara et al., Studies in SLA 2025 : cambridge.org · entraînement /r/-/l/, Zhang et al., NeuroImage 2009 : pmc
Bilinguisme — relativisation — Cognitive advantage in bilingualism: publication bias?, de Bruin et al., Psychological Science 2015 : pubmed · méta-analyse Lehtonen et al., Psychological Bulletin 2018 · réserve cognitive/démence, Alladi et al., Neurology 2013 : neurology.org
Oreille musicale & langues — Is musical ability related to second-language acquisition? A meta-analysis, Thompson, Salig & Slevc, Royal Society Open Science 2025 : pmc
Période optimale — A critical period for second language acquisition, Hartshorne, Tenenbaum & Pinker, Cognition 2018 : pubmed
Méthode Tomatis — niveau de preuve — revue Cochrane Auditory integration training… for autism : cochrane.org · position ASHA : asha.org
Santé auditive — OMS, Deafness and hearing loss : who.int · OMS, World Report on Hearing (2021) : who.int

Transcription intégrale

Transcription automatique relue ; quelques approximations possibles.

Nous sommes nés tous polyglottes, et ce qui me le fait dire, c’est que toutes les langues qui ont pourtant dégénéré par la suite, sont nées d’une même oreille au départ. Mais cette oreille était plongée dans des milieux différents, des impédances différentes, des résistances différentes, et là se créent ensuite les différences. Mais une oreille est toujours adaptable pour retrouver ses potentialités. L’homme a inventé le langage avec les organes dont il disposait. Et c’est la position debout qui l’a incité à parler ? Je crois que c’est parce qu’il a été obligé de parler qu’il s’est mis debout.

Et l’homme passe du manger à la parole, ce qui n’est pas rien. Beaucoup restent toujours au premier stade. On ne reproduit que les sons qu’on sait écouter. C’est donc la loi fondamentale. Deux décors corollaires sont que si on modifie l’audition, on modifie la fondation, et en établissant un deuxième corollaire, si la voix devient bonne, l’oreille se modifie. Au Canada, c’est intéressant de voir que tous les gens qui n’ont pas de nasalisation dans leur langue, même qui répugnent quand on les met au Canada, ils parlent comme les Amérindiens du ton, ils parlent du nez.

Parce que le Canada vibre à 1500 Hz avec une facilité déconcertante. Et au fait de passer du 1500 Hz n’importe où, vous l’entendez, à un kilomètre. Et en France, on vibre sur tout ? On vibre sur une bande passante plus large, entre 1000 et 2000, mais qui sclérose l’oreille française entre 1000 et 2000, si bien que le français, quand il utilise cette bande au maximum, il est incapable d’élargir son oreille et il n’apprend rien d’autre. C’est la langue qui siffle, parce qu’elle s’ouvre à partir de 2000 Hz à 15 000 Hz, et donc tout va être non seulement sifflé, mais diphtongué. Si bien qu’un anglais va être toujours obligé de prendre énormément de mots ailleurs, qui va prononcer jusqu’à l’imprononçable, et qui s’éloigne de plus en plus de l’écriture.

C’est pour ça qu’ils ont 360 000 mots dans leur langage. Le français, lui, il a une bande limitée sur le bande voyellitique, et il a 65 000 mots, ça lui suffit. Mais si on prenait par exemple de l’espagnol, qui est très proche de l’émission La Ringée, il n’y a pas de diphtongue. Il n’y a pas de distorsion, il n’y a pas de diphtongaison, et l’espagnol de Cervantes peut se dire aujourd’hui qu’il n’y a que 45 000 mots. Une langue va se déformer d’autant plus qu’elle est tirée vers les aigus. Un autre problème, c’est le fait que la fabrication…

L’allemand est une langue beaucoup plus établie que la nôtre, d’où son aptitude à apprendre pas mal les langues, notamment le français et l’anglais. L’allemand a plusieurs octaves, en plus il a un temps de latence pour analyser les langues qui est beaucoup plus long. Et ça implique chez lui, cette posture qu’on le connaît, il est beaucoup plus… Il est plus en rectitude que nous ne le sommes, et il est plus ouvert. Et c’est également le genre locomotive, à un moment donné, une énergie colossale, et qui est liée à cette bande passante, à cette énergie, car l’oreille, la grande fonction de l’oreille, c’est de donner au cerveau beaucoup de stimulation. Mozart, qui est un peu extérieur, donc il est un petit chien, lui, il va ne toucher qu’à un moment donné qu’aux rythmes internes du corps.

L’allemand, lui, va toucher les rythmes internes, plus le mouvement, et plus, à un moment donné, quand on écoute du Wagner, on se promène à la nature, il suffit d’entendre David Carey pour poursuivre. L’anglais est une zone intermédiaire. Mais quand on va en Allemagne, on est surpris de voir que tous les allemands parlent très bien déjà le français, ils sont préparés depuis longtemps, et nous, avec notre faculté de croire qu’on va pouvoir tout faire et commencer quand on veut, on ne parle rien pour le moment. Pas plus l’anglais que l’allemand. Alors l’allemand nous gêne un peu, parce qu’il est un peu plus complexe grammaticalement, l’anglais est une facilitation, mais c’est quand même un anglais mineur que nous utilisons. Tant qu’à faire, il vaut mieux se bouger cette jonction pour l’instant, mais ultérieurement, s’il y a une Europe, il faut être polylingue, rien à faire.

Nous nous sommes rendus compte que l’oreille, pour évoluer, est obligée de faire tout un cursus. Elle entend parfaitement dans l’utérus, et l’idée m’est venue de voir si je ne pouvais pas faire bénéficier également de ce cursus utérin pour une langue. Et c’est intéressant, quand on écume tout ce qui est langage, quand on fait passer un état utérin, il ne reste que la musique de la langue. Et là, on se rend compte combien la musique de cette langue est déjà, neurologiquement, la neurologie du système, tout est impliqué. Il y a donc une intégration plus grande. Le sujet, même ne comprenant rien, a déjà le champ de la langue.

Ah, petit prince, j’ai compris peu à peu ainsi ta petite vie mélancolique. Tu n’avais eu longtemps pour distraction que la douceur des couchers de soleil. Comment est-il ? Plus grave, plus grave, plus grave, plus grave, c’est des vraies brosses. Très bien, c’est terminé. Cette grande chute de 750 à 8000, qui s’est complètement réduite dans la mesure où le diaphragme est ouvert complètement jusqu’à 8 milliards aujourd’hui.

Je suis agréablement surpris qu’après un an d’interruption, mon oreille ait conservé, disons, les acquis au travers de la méthode Tomatis. Si je peux proposer une comparaison visuelle, pour moi, le résultat final, c’est… On peut imaginer un daltonien qui, d’un coup, verrait toutes les couleurs. J’ai réussi à écouter des choses, à entendre des choses que je n’entendais pas avant. Par exemple, j’écoutais une émission en anglais ou un film en anglais. Avant, j’avais beaucoup de mal à comprendre vraiment le sens des phrases.

Alors que là, des fois, sans vraiment y prêter attention, ça rentrait tout seul. Je me disais, tiens, mais j’ai compris. Au téléphone, surtout, d’abord par un échange qui était plus facile. On comprenait ce que l’on nous disait et on pouvait exprimer ce que l’on avait à dire. J’ai une tendance, effectivement, à avoir besoin d’entendre les sons et de mettre le volume assez fort. Et j’ai constaté, effectivement, tout à fait au début, et je pense que c’est toujours vrai aujourd’hui, que je peux baisser le volume et que j’entends quand même les sons.

J’apprécie beaucoup les films en version originale. Je ne peux pas dire que je comprends tout ce qui se dit, mais j’entends et je ressens bien que j’entends tout ce qui se dit. La posture joue un grand rôle. Donc, par exemple, on a souvent tendance à parler comme ça. Et quand on parle en français, oui, ou même un français, quand il parle anglais, il prend sa position ou n’importe quelle autre position. Alors que la position de la langue anglaise, et qui est souvent adoptée par les anglais, c’est être plus droit, avoir un dos beaucoup plus droit à ce niveau-là, une tête un peu plus droite également, ce qui fait qu’il y a plus de volume et il y a plus de richesse sonore au niveau du timbre de la voix qu’on peut émettre.

Je pense que j’écoute mieux les autres et je les entends mieux. C’est une méthode passive, c’est-à-dire qu’on peut continuer à travailler. On peut lire son courrier, préparer des réunions, indépendamment du fait qu’on subit le traitement. Ah non, c’est un peu court, jeune homme. On pouvait dire, oh Dieu, bien des choses nous en sommes, en variant le ton. Par exemple, tenez, agressif.

Moi, monsieur, si j’avais un tel nez, il faudrait sur le champ que je me l’amputasse. Amicale, mais il doit tremper dans votre tasse. Pour boire, faites-vous fabriquer un hanap descriptif. C’est un roc. C’est un pic. C’est un cap.

Que dis-je ? C’est un cap. C’est une péninsule. Eh bien, de par Dieu, je l’ai eu. Et donc, j’ai déjà fait sa voix. Puisqu’avant, il ne me parlait pas du tout.

Quand il avait 17 ans, il avait cette musculature, ce colosse que vous connaissez. Mais il était d’autant plus dangereux que je ne peux pas en placer une. Il a été plus amélioré dès que j’ai sorti sa voix. On la connaît. Il était quand même le grand de par Dieu. Mais il ne pouvait rien dire.

Et puis après, sa réputation est hantée. Il a été obligé d’intégrer des langues, notamment l’anglais. Et actuellement même, il est avec une oreille sous le bras pour essayer de jouer Columbus, qui va jouer sous peu. Parler plusieurs langues, c’est un bénéfice de parler plusieurs langues, car c’est plusieurs mentalités, c’est tout. Il faudrait parler comme Trubetskoy de 120 langues. Là, on serait tranquille.