Bric à Brac en Linguistique @babelinguiste - Tumblr Blog

Mise à Jour de l’Avent

Bonsoir tout le monde !

Oui, un grand manque d'actualité sur cette page, mais la vie n'a pas été aisée :(

En attendant le prochain article (le projet n'est pas mort, et je travaille dessus !) je vous propose de lire un des petits threads linguistiques que j'ai posté cette année sur Twitter :

1) L'orthographe et la perception sociale : https://twitter.com/lingualice/status/1125110589511098368

2) Le futur simple en français : https://twitter.com/lingualice/status/1163652358393540609

3) Le mot "cauchemar" : https://twitter.com/lingualice/status/1192707065267073024

À bientôt j'espère !

#babel #linguistique #twitter #thread #orthographe #futur #cauchemar

Bonsoir à toutes et à tous !

En parallèle de la rédaction des articles, je souhaite me lancer dans la création d’une idéolangue (ou conlang pour celleux qui connaissent le terme anglais). Cette création n’a pas de rapport direct avec les articles mais je souhaiterai savoir si cela vous intéresserait de pouvoir suivre la progression du projet.

Je ne vois pas de moyen de faire un vote sur Tumblr, mais n’hésitez pas à aimer ou partager ce billet pour montrer votre enthousiasme sur ce projet. En parallèle, je vais lancer un sondage sur la page Facebook et sur mon compte Twitter. Je mets les liens ici : https://www.facebook.com/babelinguiste/posts/535179660296758 https://twitter.com/alyss_pan/status/1078356113395994624

On se retrouve bientôt je l’espère, avec du nouveau contenu !

#babel #linguistique #sondage #conlang #ideolangue

POURQUOI « AVENT » PREND-IL UN « E » ?

Après un mois d’inactivité sur ce blog, il est temps de reprendre du service et de vous proposer un nouvel article. Lorsque nous nous étions quittés la dernière fois, nous passions à peine Halloween, et maintenant nous voici déjà dans les préparatifs de Noël, dans cette période que l’on appelle l’Avent.

Aujourd’hui donc, laissons pour une autre fois les sujets plus philosophiques et marquons ce retour par une question simple : que veut dire « Avent », et d’où vient le terme ? pourquoi donc ce « e » qui fâche par rapport à l’adverbe « avant », alors que les termes semblent similaires ? et quel est le rapport avec Noël ?

Contrairement à ce que certaines personnes (dont une jeune moi-même auparavant) peuvent penser, « Avent » n’a aucun rapport avec l’adverbe mais provient du latin adventus « arrivée, avènement », lui-même issu du verbe advenire « arriver » dont on a conservé la forme savante en français avec « advenir ». L’orthographe Avent est concurrencée par Advent après le Moyen-Âge, cette dernière étant encore majoritaire au XIVe siècle, avant de décliner au profit d’Avent et de disparaître complètement après le XVIIe siècle.

On peut d’ores et déjà voir le rapport entre « avent » et « avènement » et comprendre la présence du « e ». L’Avent est utilisé dans la tradition chrétienne pour symboliser l’arrivée prochaine de la naissance de Jésus, et est fêté tous les ans 4 dimanches avant Noël : c’est donc soit le dernier dimanche de novembre, soit le premier de décembre (cette année, il s’agit du 2 décembre). C’est une période qui dure donc 4 semaines (il est d’usage dans la tradition chrétienne d’allumer une bougie sur une couronne en comportant quatre à chaque dimanche de l’Avent) et qui a décrit dans un premier temps l’arrivée du Christ, puis a pris uniquement le sens de ladite période. C’est également parce que la période de l’Avent correspond à peu près au début du mois de décembre que l’on utilise encore aujourd’hui un « Calendrier de l’Avent » qui débute au premier décembre et se finit la veille de Noël.

Noël quant à lui est donc le jour de la célébration de la naissance de Jésus dans le rite chrétien. Si aucun texte biblique ne pose la date de cette naissance, il est très improbable (pour ne pas dire impossible) que Jésus soit né en hiver, les Évangiles faisant mention de troupeaux de bergers paissant en extérieur à cette époque. La date du 25 décembre est proche du solstice d’hiver, période importante dans les mythes païens des autres cultures, et est retenue au IVe siècle (peut-être dès 336) pour amalgamer les célébrations déjà pratiquées, comme Yule chez les peuples germains.

Le terme désignant cette fête dans les langues germaniques et nordiques est d’ailleurs resté attaché à cette ancienne célébration : Geol en vieil anglais (transcrit Yule en anglais moderne), Jol en vieux-norrois, qui donne Jól en islandais, Jul en danois, norvégien et suédois, mais également par emprunt Joulu en finnois et Jõul en estonien. Certains linguistes relient même le nom de cette fête au terme français joli, par l’intermédiaire de l’ancien français jolif.

Pour l’anglais, on trouve le terme Christmas (apparenté au néerlandais Kerstmis) signifiant « fête, messe du Christ ». On retrouve également l’abbréviation Xmas où la lettre « X » remplace un chi majuscule grec, première lettre dans cette langue du mot Χριστός Christós « Christ ». En allemand, le terme pour désigner Noël est plutôt Weihnachten « nuit sacrée ». Pour la plupart des autres langues, le nom va désigner « la naissance » : Рождество Roždestvo en russe et Boże Narodzenie en polonais, issu du vieux slavon рождьство roždĭstvo « naissance » ; Χριστούγεννα Christúgenna « naissance du Christ » en grec ; Dies Christi Natalis « jour de la naissance du Christ » en latin, de natalis « naissance ».

Le terme latin va ensuite donner les différents mots que l’on retrouve dans les langues romanes : Natale en italien, Natal en portugais ; pour les langues ne conservant pas directement le /t/, il va y avoir d’abord une lénition (c’est-à-dire un passage de fortis à lenis, le plus souvent donc d’une consonne dévoisée à une voisée) vers /d/, donnant l’ancien français *Nadal, mais également aujourd’hui en catalan et en occitan Nadal ; le /d/ intervocalique va s’amuïr en espagnol et en français, donnant Navidad dans la première (à rapprocher avec le terme « Nativité » en français), et *naal dans la seconde, puis Nael et enfin Noel (les deux termes sont attestés dès le XIIe siècle, le tréma sera ajouté en 1718 pour marquer la prononciation du son /ε/). La seule langue de la famille échappant à cette évolution est le roumain, où le terme pour Noël, Crăciun, dérive du latin creatio « création, naissance ». À noter que l’emprunt au latin et aux langues italiques est également passé dans les langues celtiques, où la racine natalis a donné les noms celtisés pour Noël : Nedeleg en breton, Nadelik en cornique et Nadolig en gallois, où la lénition a déjà eu lieu ; on retrouve aussi Nollaig en gaélique irlandais et écossais, avec un amuïssement proche de celui ayant eu lieu en français et en espagnol.

L’amuïssement que nous avons vu dans le terme français, ainsi que le couple de termes savant/populaire où l’un conserve la consonne et l’autre l’amuïe totalement, n’est pas si rare : en plus de Noël/Nativité, on peut le retrouver avec naïf/natif, nier/négation, lier/ligament ou muer/muter par exemple. Il existe un équivalent avec la lénition, où l’on peut retrouver par exemple le terme populaire œuvre mais le terme savant opus.

Ainsi, à partir d’un seul événement, et d’un étymon commun, nous avons obtenu une multitude de nos différents pour désigner une fête qui ne concerne aujourd’hui plus que les chrétiens, mais qui est aujourd’hui ancrée dans le folklore occidental. Alors, en cette période de fin d’année, je vous souhaite de bonnes choses, contente de vous retrouver, et à la prochaine fois !

#babel #linguistique #noel #christmas #avent

LA NUIT DES PEURS ET DES CELTES

Fête millénaire revisitée par différentes cultures et civilisations au fil du temps, Halloween gagne toujours en popularité en Europe et en France, bien qu’il y a encore quelques années on considérait le phénomène comme uniquement commercial. Pourtant c’est en Europe que se trouvent ses origines, même si pour cela il faut remonter à une époque où Rome ne s’était pas encore étendue hors du Latium, et où les Celtes dominaient encore pour majorité le continent.

Le Samain (ou Samhain en gaélique irlandais, prononcé le plus souvent /sɑːwɪn/) est le nom donné à une fête religieuse celte se déroulant à la fin du mois d’octobre et marquant selon les traditions la fin de l’été et le début des jours courts. C’est également le nom qui est donné au mois de novembre en gaélique irlandais et qui correspond au début de l’année pour les peuples celtes. On retrouve d’autres orthographes proches dans les autres langues celtiques : Samhainn ou Samhuinn en gaélique écossais, Sauin en mannois ; seules le gallois et le breton possèdent un mot différent pour désigner le onzième mois, respectivement Tachwedd (« abattage », sous-entendu celui du bétail dont on prend la viande pour passer l’hiver) et Du (« noir », sans doute à extrapoler des nuits longues de l’hiver arrivant).

Samhain vient du vieil irlandais samuin (ou samain ou samfhuin), et signifierait selon l’hypothèse la plus répandue « la fin de l’été » (des racines *sam « fin » et *fuin « été ») : bien que l’été ne finisse au mois d’août pour les peuples gaéliques, il est possible que le Samain ne marque pas la fin de l’été, mais la rupture entre saison claire et saison sombre (ceci étant la vision de l’année des premiers peuples celtiques). Une autre étymologie, proposée par Alexander MacBain, repose sur la racine *som « même », en proto-celtique insulaire qui serait lié au proto-celtique *samani « assemblée » (thèse soutenue auparavant par Whitley Stokes en 1907), et qui aurait donc amené une confusion dans les langues gaéliques entre « même » (ou « assemblée ») et « été ». Cette hypothèse peut également se défendre du fait que le Samain était l’une des plus grandes fêtes de la mythologie celtique, et constituait de ce fait l’une des plus importantes assemblées de l’année, laissée sous le contrôle des druides.

Le Samain est également relié religieusement au culte des morts et des dieux celtiques, honorant les divinités et respectant les défunts pour s’assurer leurs bonnes grâces pour l’hiver à venir. Cette célébration durait de trois jours (mentionné en Gaule romaine sous le nom de Tri Nox Samoni « les trois nuits du Samain » ou selon la seconde hypothèse étymologique « les trois nuit d’assemblée ») à une semaine et se déroulait souvent autour de la première pleine lune du mois de novembre. Lors de la christianisation de l’Europe dans les siècles suivants, l’Église tente d’assimiler le plus de pratiques folkloriques à la religion afin de convertir le plus facilement le plus grand nombre : ainsi, au VIIIe siècle, la fête des martyrs sera déplacée au 1er novembre et transformée en fête de tous les saints, que l’on connait aujourd’hui sous le nom de Toussaint ; la commémoration chrétienne des morts le 2 novembre sera rajoutée au Xe siècle mais il est possible que ce rapprochement des dates de célébration ne soit pas fait pour se calquer sur la fête celtique du Samain.

Le mélange des cultures entre Toussaint chrétienne et Samain celtique va perdurer pendant quelques siècle jusqu’à la migration de colons irlandais en Amérique du Nord durant le XIXe siècle. C’est à cette époque que naît alors ce qui deviendra la fête d’Halloween moderne, même si elle reste pendant un certain temps exclusivement célébrée par les migrants irlandais, n’étant acceptée par l’ensemble de la société américaine qu’à partir des années 1920. Le nom « Halloween » (sous l’orthographe Hallowe’en au Royaume-Uni) vient d’ailleurs de l’anglais, et est une contraction de All Hallows’ Even « la veille de la Toussaint ». C’est cette fête reprise dans le folklore américain que l’on célèbre aujourd’hui, et où l’on est censé se faire peur.

En parlant de peur, il peut être l’occasion de se pencher sur les phobies, ces peurs irrationnelles d’une chose, d’un lieu ou d’une situation. Le terme dérive du nom du dieu grec Phobos (Φόϐος en grec ancien), dieu de la peur panique, fils d’Arès et frère de Déimos (Δεῖμος), le dieu de la terreur ; c’est notamment pour cela qui les noms des deux dieux ont été repris pour nommer les deux satellites naturels de la planète Mars, l’équivalent romain d’Arès. Ainsi encore aujourd’hui, pour désigner la peur clinique d’une chose, on utilise un substantif avec le suffixe -phobie, et on emploie le terme équivalent avec le suffixe -phobe pour désigner les personnes atteintes de la phobie.

La plupart des noms de phobies emploient des racines grecques, quelques rares sont latines, ainsi la connaissance de ces racines peut aider la compréhension du mot : par exemple, l’arachnophobie est la peur des araignées (du grec ἀράχνη aráchnē « araignée ») ; l’agoraphobie est la peur des espaces publics (du grec ἀγορά agorá « lieu de rassemblement ») ; l’hématophobie est la peur du sang (du grec αἷμα haíma « sang ») ; la claustrophobie est la peur des espaces exigus (du latin claustra « fermeture »)… Le mot peut avoir une attestation ancienne, tout comme être un néologisme récent construit à partir des racines savantes, comme la coulrophobie (du grec κωλοϐαθριστής / kôlobathristếs « acrobate sur des échasses », et qui désigne la peur des clowns), l’aérodromophobie (la peur des avions) ou la sidérodromophobie (la peur du train).

À noter enfin que certains inventent des termes de phobies fictives et parodiques sur le même principe, comme l’anatidaephobie de Gary Larson (« la peur que quelque part, d’une façon ou d'une autre, un canard vous observe » ; du latin anatinus « canard »), ou sa luposlipaphobie (« la crainte excessive d’être poursuivi par des loups sur le parquet fraîchement ciré d’une cuisine en ne portant que des chaussettes aux pieds » ; du latin lupus « loup » et de l’anglais slip « glisser »). On a également l’eibohphobie ou la peur des palindromes (le nom en étant lui-même un) ou l’hippopotomonstrosesquipédaliophobie, composé de l’anglais hippopotamus « hippopotame », du latin monstrŭōsus « monstrueux » et de l’anglais sesquipedalian « qui comporte beaucoup de syllabes » (lui-même issu du latin sesquipedalis « long d’un pied et demi »), et qui représente la peur des mots trop longs.

Bien du chemin a été fait pour en arriver des celtes à notre Halloween moderne, et si l’on lui adjoint tout ce que nous venons de dire sur le grec et les mots désignant la peur, on peut bien conclure à un caractère très mondial de cette célébration.

#babel #linguistique #samain #samhain #halloween #phobie #peur #novembre

DES LANGUES SANS FAMILLE

Depuis le lancement de ce blog, nous avons énormément parlé d’étymologie, de l’origine de certaines langues et des relations qu’elles ont entre elles. Si nous avons pu voir que l’Hypothèse de Babel (ou plus scientifiquement la monoglottogenèse, ou encore origine linguistique unique) est difficilement prouvable ou réfutable tout comme l’hypothèse inverse (la polyglottogenèse, ou origine linguistique multiple), l’état actuel des connaissances en linguistique comparée nous permet de remonter et de relier la plupart des langues du monde en un nombre restreint de familles génétiques ou géographiques (les fameuses Sprachbünde). Cependant certaines langues résistent à cette classification, et sont donc uniques en leur genre.

On appelle ce genre de langues des isolats, et il s’agit donc de langues qui n’ont aucune filiation génétique avec une autre langue connue. Une restriction peut être faite concernant le caractère vivant des potentielles langues parentes : ainsi, une langue telle que le pirahã est devenu sous cette définition un isolat lorsque toutes les autres langues de la famille des langues muras à laquelle il appartient se sont éteintes, laissant le pirahã comme seul représentant de la famille.

Dans un cadre beaucoup plus strict, un isolat ne peut être relié à aucune autre langue documentée, vivante ou morte. Ils constituent ainsi leur propre famille linguistique : le site de référencement linguistique Glottlog recensait au 22 novembre 2017 (date à laquelle je m’étais renseignée sur le site) pas loin de 7000 langues réparties en 235 familles génétiques (comme les langues indo-européennes, les langues sino-tibétaines, les langues dravidiennes, etc.) et un total de 187 isolats. À savoir que cette liste a peut-être évolué depuis l’an dernier, je n’ai pas forcément mis à jour ma liste.

Car oui, le statut des isolats peut varier : on a déjà dit que dans la définition la plus large du terme, une langue référencée dans une famille peut devenir un isolat, mais un isolat peut également perdre ce statut si un lien génétique de parenté est attesté avec au moins une autre langue (grâce à la méthode de la linguistique comparée donc, je vous conseille l’article sur le sujet si vous voulez plus d’informations). C’est le cas du ket, langue de Sibérie parlée par environ 200 personnes au dernier recensement, qui était un isolat avant 2010 et fait désormais partie de la famille na-déné, dont la majorité des langues sont parlées en Amérique du Nord, de l’autre côté du détroit de Bering.

Dans la liste des isolats, on trouve souvent des langues de peuples isolés (Océanie) ou dont la documentation s’est faite tardive (langues indigènes d’Amérique, aborigènes…). On trouve également des langues anciennes ayant disparues avant l’invention de l’écriture et dont on ne possède que des témoignages indirects, ou bien des langues anciennes n’ayant déjà plus aucun autre parent encore vivant lorsqu’elles ont été documentées : c’est le cas du sumérien qui fut parlé entre les IVe et IIIe millénaires avant notre ère avant d’être assimilé et remplacé par l’akkadien (une langue sémitique), et dont l’ancienneté pose un frein à la filiation génétique. Mais on trouve également des langues bien documentées et connues depuis un long moment, mais dont aucun parent n’a été retrouvé, l’exemple le plus connu étant le basque.

Le basque (ou euskara en basque) est une langue très ancienne et l’implantation du peuple parlant la langue en question en Europe date de la fin du Néolithique, soit avant l’arrivée des premiers peuples indo-européens sur le continent. Le peuple basque est resté plus ou moins isolé des autres peuples pendant plusieurs milliers d’années, et même si des emprunts ont été faits aux langues indo-européennes (on estime que 75% du vocabulaire basque provient des langues celtes, du latin et des langues romanes après la conquête romaine), sa grammaire, sa syntaxe et une partie de son vocabulaire restent majoritairement différent de toutes les autres langues parlées en Europe.

L’ancêtre du basque moderne, appelé par désignation systématique le proto-basque, est selon certains linguistes comme Larry Trask une langue appelée aquitain, parlée dans la région de l’Aquitaine avant la conquête romaine des Gaules, puis dans la province de Novempopulanie, et qui a perduré jusqu’au début du Moyen-Âge. Pour d’autres, le basque est également lié à l’ancienne langue ibère (parlé sur la côte méditerranéenne de l’actuelle Espagne entre le IIe et le Ier millénaire av. EC) ou d’autres langues non-indo-européennes, sortant ainsi le basque de son statut d’isolat et créant la famille des langues vasconiques. D’autres hypothèses ont même également lié cette langue au picte (parlé dans les Lowlands écossais entre le IIIe et le IXe siècle), aux langues afro-asiatiques, aux langues dravidiennes ou même aux langues chinoises. Cependant ces hypothèses sont peu documentées ou très controversées à l’heure actuelle, et le basque est toujours considéré comme un isolat pur.

Le basque possède en règle générale un ordre SOV, même si un système de déclinaison à treize cas permet une liberté dans le placement des éléments ; on rencontre également dans un style soutenu les ordres OSV et OVS. Le système de déclinaison est toutefois radicalement différent comparé à ce qui se fait dans les langues indo-européennes car (exception faite des langues caucasiennes, si l’on considère que le Caucase fait partie de l’Europe) c’est la seule langue d’Europe à reposer sur un système d’actance ergatif/absolutif, toutes les autres langues d’Europe (y compris le finnois, le hongrois et l’estonien, trois langues non-indo-européennes) sont des langues à système nominatif/accusatif ; nous reviendrons sur l’actance dans un futur article, mais gardons pour l’instant l’idée d’exotisme de cette langue située à cheval sur le territoire français et espagnol.

C’est peut-être sur cet aspect géographique que repose sa plus grande faiblesse, car si la constitution espagnole de 1978 permet à la communauté bascophone de faire de leur langue une langue co-officielle du pays basque espagnol avec le castillan, la France ne reconnait que le seul français en tant que langue officielle. L’Espagne a de plus signé la Charte européenne des langues régionales ou minoritaires en novembre 1992 et l’a ratifiée en avril 2001, alors que la France ne l’a signé qu’en mai 1999 et ne l’a jamais ratifié, rendant inutile cette protection des langues historiques régionales et ou de minorités d’Europe. Aujourd’hui un peu plus de 28% des habitants du pays basque parlent basque, jusqu’à 45% si l’on compte les personnes comprenant la langue sans la parler. Une langue unifiée issue des différents dialectes existant alors lors de sa création en 1968 a commencé à supplanter les dialectes historiques et à se diffuser plus largement grâce aux médias de communication : journaux, radio, mais aussi récemment internet. Si le sort de la langue est encore inquiétant en France tant qu’aucune protection légale envers les langues minoritaires ne sera prise, le basque ne risque pas, comme ses potentielles langues parentes inconnues, de disparaître de sitôt sans laisser de traces…

#babel #linguistique #basque #euskara #isolats #isolates

POURQUOI L’ANGLAIS S’ECRIT-IL AINSI ?

Lors de ma scolarité quand j’apprenais l’anglais (et pour en avoir discuté avec mes collègues de langues depuis que je suis enseignante), il m’a été facile de constater que l’orthographe de l’anglais était très compliquée et peu reliée à sa prononciation, autant si ce n’est plus que celle du français. Certaines de mes amies n’étant pas d’accord avec moi sur le sujet et affirmant que l’anglais avait sa propre logique d’orthographe (ce que je ne nie pas : elle est juste selon moi trop compliquée), il me paraissait intéressant de revenir sur ce qui fait que certaines langues comme le français ou l’anglais étaient si compliquées à écrire, et sur ce qui fait la particularité de l’anglais en la matière…

Lorsque les règles orthographiques d’une langue sont posées, elles essaient dans un premier temps de respecter la logique phonologique de la langue : un phonème par unité graphique, une unité graphique par phonème. Cette règle se retrouve plus ou moins bien respectée dans de nombreuses langues comme l’allemand, l’italien ou le polonais. Chose intéressante, pour les deux premières langues citées, les règles orthographiques n’ont été posées que récemment (à l’échelle linguistique) pour la langue standard, les pays en question ne s’unifiant que tardivement : 1871 pour l’Allemagne et un an auparavant pour l’Italie. Ainsi, les règles orthographiques posées à la fin du XIXe siècle et correspondant à la phonologie des langues à cette époque sont encore d’actualité car ces dernières n’ont que très peu évoluées sur le plan phonétique depuis.

À côté de cela, les standards du français et de l’anglais sont posés vers le XVe siècle, plus de 60 avant les écrits de Rabelais (qui sont déjà dans un français daté que l’on peut avoir du mal à comprendre aujourd’hui). L’orthographe de ces langues a peu varié depuis lors (même si certaines combinaisons de lettres sont tombées en désuétude, comme le sç- de sçavant ou l’ign- de montaigne, donnant en français moderne « savant » et « montagne »), et ainsi le problème devient vite apparent : si l’orthographe de l’anglais est si compliquée, c’est que l’on l’écrit comme il était prononcé il y a 600 ans, à la période du moyen-anglais ; si le mot time s’écrit avec un i, c’est qu’à l’origine il correspondait bien à un phonème /i:/ ; si name prend un a, c’est qu’on le prononçait /na:mə/, à comparer avec l’allemand moderne Name /naːmə/.

Dans le cas du français, c’est peut-être même pire, car si effectivement l’orthographe reflète la prononciation du moyen-français (d’où par exemple la combinaison -au ou -eau pour noter /o/ aujourd’hui, mais qui représentait d’abord respectivement une diphtongue et une triphtongue), la codification de la langue par l’Académie Française à partir de la moitié du XVIIe siècle va permettre le retour dans la graphie de lettres disparues de la prononciation mais rajoutées à l’orthographe pour rappeler l’étymologie du mot (le latin ou le grec apparaissant alors comme des langues nobles, donnant à la langue un statut particulier) : vint prononcé /vɛ̃t/ sera affublé du g pour rappeler le latin viginti de même sens, et aujourd’hui le mot « vingt » se prononce même /vɛ̃/ dans la plupart des dialectes du français ; le mot pois prononcé /pois/ puis /pwɛs/ ou /pwɛ/ avant d’arriver au moderne /pwa/ prendra le d du latin pondus, alors qu’il a été attesté depuis que l’origine du mot « poids » se retrouve en réalité dans le mot latin pensum de même sens !

Lorsqu’une langue utilise une norme orthographique non-réformée ou peu réformée alors que la langue parlée continue d’évoluer et que la forme écrite ne correspond plus à la version orale, on a à faire à une orthographe vestigiale. C’est donc le cas en anglais, en français, mais également en thaï ou en tibétain (où la dernière réforme orthographique date du IXe siècle !). Cependant, cela n’explique pas tout à fait ce qui fait de l’anglais une langue tant à part dans son évolution phonologique. La réponse date d’après la normalisation de l’orthographe anglaise : le Grand Changement Vocalique, ou Great Vowel Shift en anglais.

Ce phénomène décrit une série de mutations des voyelles longues du moyen-anglais jusqu’à leurs prononciation en anglais moderne, qui a commencé au milieu du XIVe siècle et s’est poursuivi jusqu’à la fin du XVIIe siècle. Ces mutations ont eu lieu dans tous les dialectes de l’anglais, bien que des variations locales aient eu lieu.

Récapitulatif du Grand Changement Vocalique d’après « Great Vowel Shift », par Olaf Simons, licence CC-BY-SA

On peut notamment apercevoir que la plupart des voyelles du moyen-anglais se sont fermées (/ɛ/ passant à /e/, lui-même passant à /i/, ce dernier se diphtonguant en /ɛi/ ; /ɔ/ passant à /o/, lui-même passant à /u/, ce dernier se diphtonguant en /ɔu/) avant d’entamer un processus de diphtongaison après le XVIIe siècle (ce processus n’entrant pas en compte dans le Grand Changement Vocalique). Le Grand Changement Vocalique n’a pas touché tous les dialectes de l’anglais de la même manière, et si au sud de l’Angleterre le son /i:/ a muté en /ai/ (comme dans time /taim/), les dialectes du nord et le Scots ont quant à eux obtenu le son /ɛi/ (ainsi time se prononcera /tɛim/).

Le Grand Changement Vocalique est considéré comme presque terminé à partir de 1700, mais son empreinte sur l’anglais est telle que sa prononciation est exotique des autres langues germaniques. Pour donner une idée de la quantité de changements que cela a apportés, 96 des 154 sonnets de Shakespeare (qui a vécu et écrit sur la fin du Grand Changement Vocalique) possède des vers qui aujourd’hui ne riment plus ! Il faut également ajouter à cela une simplification du système de consonne au XVIe et XVIIe siècle, notamment sur les groupements : rare sont les consonnes affriquées en anglais, et des anciens groupes ayant existé en moyen anglais, seule la deuxième consonne est encore prononcée (knight est passé de /knixt/ à /nait/, psalm se prononce désormais /sɑːm/ et pneumonia /njuˈməʊniə/…).

L’anglais moderne possède donc un système orthographique archaïque qui n’est plus adapté à sa prononciation : aujourd’hui chaque voyelle graphique possède entre jusqu’à une dizaine prononciations différentes, et un seul et même phonème peut s’écrire d’une vingtaine de façons différentes. Pour se moquer de cela, Charles Ollier propose en 1855 l’orthographe ghoti pour écrire le mot fish « poisson », car comme il l’explique : gh se prononce /f/ dans enough, o se prononce /i/ dans women, et ti se prononce /ʃ/ comme dans nation. Cette orthographe est parodique et ne serait pas logique en anglais (en effet, le gh ne se prononce jamais /f/ en début de mot, et le ti ne se prononce /ʃ/ que s’il est suivi d’une voyelle), d’autant que d’autres pourraient affirmer que ghoti est un mot complètement muet, en trouvant sur le même principe des exemples de mots où chaque lettre est muette (l’anglais est en effet une langue où il existe au moins un mot où chaque lettre de l’alphabet latin n’est pas prononcée).

Dès l’époque du Grand Changement Vocalique, des propositions de révision de l’orthographe de l’anglais ont vu le jour, puis regagnant en popularité au XIXe siècle. Certaines personnes proposent également aujourd’hui de changer l’alphabet dans lequel est écrit l’anglais, afin d’avoir un système non seulement basé sur la phonétique de la langue, mais permettant d’éviter les digrammes comme sh, th, ch, etc. Ces mêmes mouvements de proposition de révision de l’orthographe existent en français, comme la notation Alfonic conçue dans les années 1970 ou la norme Ortograf-fr parmi d’autres. Ces systèmes d’écritures de la langue semblent aujourd’hui barbares à nos yeux habitués à l’orthographe traditionnelle, mais ne peut-on pas se demander pourquoi nous nous entêterions à garder un système si compliqué autrement que pour la tradition, si en adopter un autre permettrait de réduire les difficultés des apprenants et le temps d’apprentissage du code écrit de la langue ?

#babel #linguistique #anglais #great vowel shift #grand changement vocalique #orthographe

DIFFERENTES FAÇONS DE DONNER DE LA VOIX

Aujourd’hui, revenons sur un aspect plus technique de la parole : nous avions déjà vu les bases de l’Alphabet Phonétique International, mais il existe des différences que nous n’avions pas pu aborder dans l’article en question. Nous savons former des consonnes, des voyelles, mais y a-t-il d’autres moyens de les produire ?

Les mots « consonne » et « voyelle » reflètent tous deux un aspect de phonation, puisque « voyelle » vient de l’ancien français voieul de même sens, issu du latin vocalis « vocal, qui fait entendre un son », dérivé du mot vox « voix » ; le mot « consonne » quant à lui provient du latin consona « qui sonne avec » et est un emprunt (un mot directement pris d’une autre langue) du XVIe siècle, composé de con- ou cum- « avec » et sona « son », à rapprocher du grec συμφωνία sumphônía « accord, ensemble de sons », qui a donné le mot français « symphonie ».

Aussi, je tiens à faire un léger erratum : contrairement à ce que j’avais dit dans l’article sur l’API, une voyelle arrondie n’est pas définie que par un arrondissement des lèvres, mais également de la langue dans la cavité buccale (et de même une voyelle non-arrondie est définie par un aplatissement de la langue dans la bouche) ; l’arrondissement ou non des lèvres n’en est donc pas l’unique cause, et pourrait être vu comme en étant une conséquence.

Jusqu’alors, j’avais uniquement évoqué le cas des voyelles orales, celles pour lesquelles l’air passe seulement par la bouche. Cependant il existe d’autres types de voyelles, comme les voyelles nasales dont la production résulte d’un passage simultané de l’air dans le canal buccal et la cavité nasale. Comparez à cet effet « pâte » et « pente », qui à l’exception de la nasalisation se prononcent de la même manière : /pɑt/ pour le premier et /pɑ̃t/ pour le second. Le caractère nasal d’une voyelle se représente dans l’API par un tilde au-dessus de la voyelle.

On dit souvent que les voyelles nasales sont présentes dans une minorité de langues du monde, mais en vérité toute langue possédant des consonnes nasale a à faire à une nasalisation (au moins légère) des voyelles précédentes. Mais dans ce cas, pourquoi les anglais ont-ils autant de mal à prononcer les voyelles nasales du français ? En fait, le problème n’est pas tant de posséder ou non des voyelles nasales dans sa langue, mais de faire une distinction phonologique entre la voyelle orale et la voyelle nasale : dans le cas de l’anglais, la nasalisation est un procédé naturel et automatique, mais les voyelles orales et nasales correspondantes ne sont pas considérées comme différentes (plutôt comme deux réalisations proche du même son) ; en français et dans une minorité d’autres langues (incluant le polonais, le portugais et le breton notamment), la voyelle nasale ne sera pas considérée comme une variation de la voyelle orale, mais comme une autre voyelle à part entière.

Si l’on parle ensuite de la phonation des voyelles, c’est-à-dire du type de voix que l’on va utiliser pour les produire, on distingue trois grands types : la voix modale, la voix craquée et la voix soufflée. Pour l’instant, j’ai uniquement parlé de voix modale, sans vraiment la définir. Il s’agit du mode de phonation où les cordes vocales vont vibrer selon un cycle dans lequel elles seront ouvertes la moitié du temps et fermées l’autre moitié du temps. Pour la voix craquée (aussi appelée laryngalisation) le larynx se resserre et comprime les cordes vocales, entraînant un cycle dans lequel les cordes vocales restent plus longtemps fermées qu’ouvertes : la voix est alors plus grave, et on perçoit aisément les vibrations individuelles des cordes vocales. La voix soufflée (également appelée murmure) produit au contraire un cycle où les cordes vocales sont plus longtemps ouvertes que fermées, laissant passer plus d’air et faisant à peine vibrer les cordes vocales. Une voyelle laryngalisée est notée par un tilde en-dessous de la voyelle (par exemple [o̰]) tandis qu’une voyelle murmurée est notée par un tréma en-dessous de la voyelle (par exemple [e̤]). Comme pour les voyelles nasales, il existe peu de langues faisant une distinction phonologique entre voix modale, voix craquée et voix soufflée : un exemple serait le mazatèque de Jalapa, parlé au Mexique et qui compte cinq voyelles ([i], [æ], [a], [o] et [u]), mais surtout six différentes réalisations pour chaque, orale modale, orale craquée, orale soufflée, nasale modale, nasale craquée et nasale soufflée.

Concernant les consonnes, nous avions défini le caractère sonore (ou voisé) comme étant une vibration des cordes vocales lors de la production de la consonne (comme pour [v]) et le caractère sourd (ou non-voisé) comme étant une absence de vibration des cordes vocales (comme pour [f]). Même si c’est effectivement vrai, on peut également distinguer les paires sonore/sourde à l’aide de deux autres techniques : le VOT et la différentiation fortis/lenis.

Le VOT pour Voice Onset Time en anglais (que l’on pourrait traduire par « Durée d’Établissement du Voisement ») compare le temps qu’il faut à la vibration des cordes vocales pour revenir suite à son interruption et au relâchement d’une consonne (ici, des occlusives) : pour les consonnes sourdes, la durée est souvent inférieure à 30 ms et toujours imperceptible, et on dira alors que ces consonnes ont un VOT nul (on parle alors de tenuis pour ces consonnes) ; pour les consonnes sonores, la vibration des cordes vocales revient pendant l’occlusion et avant le relâchement, provoquant un VOT négatif ; il existe cependant un autre cas possible, celui où la vibration revient après un temps perceptible (plus de 60 ms en général, mais les durées sont variables en fonction des occlusives et des langues) et où le VOT est alors positif, et dans ce cas on parle de consonne (sourde) aspirée.

Le français ne possède pas de consonne aspirée et n’a donc que des consonnes avec VOT0 ou VOT-, mais l’anglais possède une telle distinction : le son /p/ dans spy /spaɪ/ correspond à un VOT0, tandis que celui de pie /pʰaɪ/ possède un VOT+ (et pour comparaison, buy /baɪ/ a lui un VOT-). Pourtant en anglais, /pʰ/ et /p/ sont considérés comme des réalisations de la même consonne, s’opposant à /b/, alors qu’en mandarin, /b/ et /p/ sont considérés comme étant la même consonne s’opposant à /pʰ/. La perception de ce qui fait qu’une consonne est différente et constitue bien une consonne à part entière est donc variable en fonction des langues.

La distinction fortis/lenis (du latin pour « fort » et « faible ») a été originellement utilisée pour faire une différentiation dans la force et la tension avec lesquelles sont prononcées les consonnes. Comparativement au VOT, plus une consonne tend vers un VOT+, plus elle relève du fortis et au contraire, plus elle tend vers un VOT-, plus elle relève d’un lenis. Cette distinction a été tout d’abord pensée pour les langues faisant leurs distinctions entre consonnes sur d’autres bases que le voisement, et peut expliquer pourquoi nous réussissons tout de même à faire la différence entre une consonne sonore et une consonne sourde même lorsque l’on parle en voix soufflée.

Les consonnes pourront cependant se voiser ou se dévoiser en fonction de leur place dans le mot : ainsi, si la plupart des langues voient un dévoisement des consonnes finales (allemand Tag /taːk/ ou Hund /hʊnt/, russe кровь krov /krɔfʲ/…), l’anglais procède plutôt à un voisement de ces dernières. On peut également noter qu’une consonne sonore et une consonne sourde ne peuvent cohabiter : dans le cas d’une affrication, l’une des consonnes va changer de phonation pour que les deux consonnes soient toutes les deux soit sourdes, soit sonores : par exemple absent est prononcé /apsɑ̃/, par assimilation antérograde du /b/ sonore en /p/ sourde, ou cheval peut être prononcé /ʃfal/ par assimilation prograde du /v/ sonore en /f/ sourde. De quoi donner encore beaucoup de manière d’articuler nos mots…

#babel #linguistique #voyelle #consonne #API #voisement #phonation

LE PAYS AUX MILLE-ET-UN NOMS

La plupart des pays du monde possède une constance dans le nom qui leur est donné d’une langue à l’autre. Certains respectent ce modèle strictement, ayant le même endonyme (le nom donné au pays dans la langue locale) et le même exonyme (le nom donné au pays dans les autres langues), ou variant juste orthographiquement, comme le Portugal ou la France ; d’autres possèdent un exonyme utilisé par toutes les langues ou presque, mais très différent de l’endonyme, comme la Hongrie (Hungary en anglais, Ungarn en allemand, Ungheria en italien, mais Magyarország en hongrois) la Finlande (Finland en anglais et en suédois, Finlandia en espagnol et en italien, mais Suomi en finnois) ou le Japon (Japan en allemand et néerlandais, Japão en portugais, Giappone en italien, mais 日本 Nihon en japonais) ; mais le pays qui nous intéresse aujourd’hui est très particulier, car aucun de ses voisins n’ont réussi à se mettre d’accord sur la manière de l’appeler. Et ce pays est tout simplement l’Allemagne.

Situé au centre de l’Europe, l’Allemagne est bordée par neuf pays et est également au carrefour de plusieurs zones linguistiques : les langues germaniques occidentales au nord-ouest et à l’ouest, auxquelles l’allemand appartient lui-même ; les langues scandinaves (ou germaniques septentrionales) au nord ; les langues romanes à l’ouest et au sud-ouest ; les langues baltes et slaves à l’est. Le pays possède un endonyme, Deutschland, qui sera repris pour certains exonymes, mais également cinq autres groupes d’exonymes aux étymologies complètement différentes : on dira Allemagne en français, mais Germany en anglais, Saksa en finnois Niemcy en polonais, ou Vokietija en lituanien. Comment en est-on arrivé à une telle situation ?

La réponse, comme souvent, se retrouve dans l’histoire du pays et de la langue : le pays que l’on connait aujourd’hui sous le nom d’Allemagne est très récent dans l’histoire de l’Europe, puisque né en 1871 lors de la proclamation de l’Empire Allemand, unifiant alors les différents royaumes, duchés et territoires de l’ancien Saint Empire Romain Germanique. Le Saint-Empire ayant été aboli peu après la victoire napoléonienne à Austerlitz sur l’Autriche et la Russie, les différents états et territoires ont d’abord été réorganisées autour de la Confédération du Rhin entre 1806 et 1813, puis de la Confédération germanique entre 1815 et 1866, et enfin de la Confédération d’Allemagne du Nord entre 1867 et 1871 avant l’avènement de l’Empire. Cela étant, ce que je vous propose ici est un résumé extrêmement rapide faisant l’impasse sur beaucoup de détails importants, et de plus je ne suis pas historienne, donc je vous conseille de vous renseigner par vous-même sur le sujet de l’unification allemande. Quoi qu’il en soit, il est important de retenir qu’avant la fin du XIXe siècle, il n’existe pas un unique état pour les peuples parlant allemand (ce qui entre autres va motiver cette unification autour de la Confédération de l’Allemagne du Nord en 1871), mais une multitude d’états issus chacun d’un peuple ou d’une tribu du début du Moyen-Âge.

L’allemand en tant que langue descend justement du proto-germanique, parlé entre 750 av. EC et l’an 300 de notre ère sur les rives de la Mer du Nord, de la Mer Baltique et dans la péninsule du Danemark actuel ; c’est donc une langue sœur du néerlandais, cousine du danois ou de l’anglais et ayant un lien très distant avec le français par l’intermédiaire du proto-indo-européen. Le proto-germanique se sépare ensuite en trois branches : les langues germaniques septentrionales, aussi appelées langues scandinaves, descendant du vieux norrois ; les langues germaniques orientales, aujourd’hui toutes éteintes ; les langues germaniques occidentales, où l’on retrouve l’anglais, le néerlandais et l’allemand.

Si l’on met de côté l’anglais de par sa situation particulière dans la famille langues germaniques (plus isolée que les autres car sur une île, et subissant l’influence franco-normande à partir du XIe siècle, modifiant durablement son vocabulaire), on peut constater que les langues germaniques occidentales forment un continuum dialectal, que les linguistes découpent en trois sous-groupes de dialectes : ceux du haut-allemand, parlées en Bavière, dans le Wurtemberg, dans les Alpes suisses et en Autriche ; ceux du bas-allemand, parlé le long des côtes, aux Pays-Bas et dans les Flandres belges ; et ceux du moyen-allemand, situés entre les précédents. Si aujourd’hui la plupart des dialectes du bas-allemand sont inter-compréhensibles, de même que pour le haut-allemand, il n’en a pas toujours été ainsi, et il est encore parfois compliqué pour des locuteurs du sud de l’Allemagne de comprendre les dialectes du Nord (le groupe moyen-allemand se trouve à mi-chemin entre les autres groupes, la compréhension est alors plus ou moins aisée). L’allemand standard parlé aujourd’hui est quant à lui issu historiquement du groupe du haut-allemand, bien qu’il s’agisse plus d’un compromis de plusieurs dialectes de tout le territoire.

Justement, le groupe haut-allemand apparaît vers le VIe siècle avec l’émergence du vieil-haut-allemand et la seconde mutation consonantique, que nous avions déjà évoqué dans l’article sur Comment groupe-t-on les Langues ? et dont je rappelle rapidement les oppositions haut-allemand/bas-allemand constatées : machen/maken « faire », dag/Tag « jour », eten/essen « manger », zitten/sitzen « s’asseoir », slapen/schlafen « dormir », paard/Pferd « cheval », avond/Abend « soir ». C’est à partir de ce moment-là que l’on va pouvoir parler d’allemand en termes linguistiques. Le haut-allemand continue d’évoluer, et l’allemand moderne naissant apparaît vers le XIVe siècle et est assez peu différent de l’allemand moderne que l’on connaît aujourd’hui. La langue et son évolution seront ensuite étudiées et référencées par les frères Grimm entre 1852 et 1860, et nous aurons l’occasion de reparler d’eux dans un futur article. Lors de l’unification du pays en 1871, l’allemand standard devient la langue officielle de l’Empire, et alors basée sur plusieurs dialectes, notamment haut-allemands, et ayant supposément la prononciation des dialectes bas-allemands, même si la prononciation va en vérité varier de région en région. L’orthographe est réfléchie de manière phonétique et la grammaire est officiellement adoptée en 1901 ; l’allemand ne verra pas ou peu de réformes avant la rectification orthographique de 1996 qui commencera à s’appliquer en 1998.

Mais tout cela ne nous explique pourtant pas pourquoi tant de noms différents pour l’Allemagne ! Patience, j’y arrive : nous disions donc qu’avant 1871 chaque état de langue allemande était indépendant (en fonction des époques, ils pouvaient dépendre du Saint-Empire ou d’une Confédération, mais pas d’État-Nation à proprement parler). Chaque voisin des différents peuples germaniques développe donc un nom pour le peuple qui lui est frontalier, et ce nom se retrouvera souvent être repris pour désigner la nation allemande après son unification.

L’endonyme Deutschland, que l’on retrouve également en néerlandais Duitsland, en luxembourgeois Däitschland, en danois, norvégien et suédois Tyskland et en islandais Þýskaland, provient du mot deutsch auquel on a adjoint Land « pays, terre ». Deutsch (qui est également le mot voulant dire « allemand » en allemand) vient quant à lui du vieil-haut-allemand diutisc et du proto-germanique *þiudiskaz « populaire ». Le terme est alors employé par les peuples germaniques et désigne toute personne parlant un dialecte germanique, pour faire opposition aux peuples parlant des langues italiques ou celtiques, qui seront désignés par le terme walesc « étranger », dont dériveront les termes anglais Wales « Pays de Galles » ou welsh « gallois », ainsi que le mot français Wallonie. Diutisc sera latinisé en theodiscus, donnant en français « tudesque » (apparenté avec le terme « teuton ») et l’italien tedesco, qui désigne une personne allemande ou la langue allemande, bien que l’italien n’utilise pas la même racine pour le nom du pays. Le terme Diutisc donnera également le terme anglais Dutch, désignant… le néerlandais (histoire de semer un peu la confusion linguistique en amenant un autre peuple germanique dans l’imbroglio).

Les exonymes se regroupent comme nous l’avons dit en cinq autres catégories :

Le terme latin Germania « Germanie » désigne les différentes tribus du nord-est de la Gaule lors de son apparition au IIIe siècle av. EC, puis s’étend aux peuples outre-Rhin n’appartenant pas à l’Empire Romain. On le retrouve en français dans « germanique » et c’est ce terme générique désignant les peuples au nord du Danube et à l’est du Rhin qui est repris en anglais avec Germany, en italien et en roumain avec Germania, en grec avec Γερμανία Germanía, en russe avec Германия Germaniya, etc.

Plus spécifiquement, les finlandais et les estoniens réfèrent à l’Allemagne en parlant de Saksa (finnois) ou Saksamaa (estonien), issu du nom du peuple saxon et de la Saxe. Il est intéressant de noter que ce terme a été repris également dans certaines langues celtes, mais pour désigner l’anglais (comme lorsqu’on parle « d’anglo-saxons ») : sassenach en gaélique écossais, Saoz en breton et Sais en gallois.

De notre côté, nous avons désigné l’Allemagne à partir du nom du peuple des Alamans, tout comme en espagnol (Alemania), en catalan (Alemanya), en portugais (Alemanha), en breton (Alamagn), en gallois (Yr Almaen) ou en turc (Almanya)… Ce peuple habitait vers le sud-ouest de l’Allemagne actuelle, soit le Bade-Wurtemberg, la Suisse alémanique (qui en tire son nom) et l’Alsace. Le terme Alaman vient du proto-germanique *Alamanniz et pourrait signifier « tous les hommes » (comprendre ici « tous les hommes parlant la même langue », construit donc sur le même modèle que diutisc) ; c’est en tous cas l’hypothèse la plus probable, mais il n’est pas impossible que le *ala veuille dire « autre » et que le terme désigne alors « les étrangers ».

Dans la plupart des langues slaves, le terme pour l’Allemagne dérive du terme signifant encore une fois « étranger » : němьcь en proto-slave, dérivé du terme němъ « muet ». Il faut ici comprendre « muet » dans le sens « qui ne parle pas notre langue », donc apparenté au sens d’étranger. Si le terme désigne à l’origine tous les étrangers non-slaves, il se restreint pour désigner les allemands et l’Allemagne : Niemcy en polonais, Německo en tchèque, Немачка Nemačka en serbe, Njemačka en croate, etc. Le terme s’est également propagé au hongrois (Németország), puis jusqu’à l’Orient – arabe نمسا Nimsā et persan نمچه, Nemçe – bien que dans ces langues le terme désigne l’Autriche.

Les autres noms de l’Allemagne sont soit d’origine inconnue, soit d’origines diverses ou peu employées. Parmi les termes d’origine inconnue, on trouve le cas des langues baltes, où « Allemagne » se dit Vācija en letton et Vokietija en lituanien (on émet l’hypothèse que les exonymes soient apparentés à un terme voulant dire « peuple », mais rien n’est prouvé actuellement). Pour ce qui est des cas divers, on trouve Bawory en sorabe (langue slave parlée à la frontière germano-polonaise), qui dérive du nom de la Bavière, Purutia en tahitien, qui est la déformation de l’anglais Prussia « Prusse », ou encore Suðrvegr « chemin du sud » en vieux norrois, par opposition au mot Norðvegr « chemin du nord » qui a donné le nom Norvège.

Comme nous l’avons dit, l’Allemagne est très jeune dans le paysage européen, encore plus si l’on considère que cela fait tout juste 28 ans que le pays est réunifié (depuis le 3 octobre 1990), et contrairement à la situation entre les deux Corées, la séparation de l’Allemagne pendant la Guerre Froide n’a pas entraîné de changement dialectal important entre l’Est et l’Ouest. L’allemand reste aujourd’hui de façon surprenante la langue maternelle la plus parlée en Europe, par près de 16% des citoyens de l’UE et devant le français, l’italien et l’anglais. C’est cependant une langue dont l’apprentissage en France est très discrédité, car soit considérée comme trop complexe (par rapport à l’espagnol ou à l’anglais, ce qui est en partie vraie car son lien de parenté avec le français est beaucoup plus ténu que pour les deux autres langues citées plus tôt), soit délaissée pour une soi-disant « élite »…

Certes, l’allemand ne peut plaire à tout le monde, mais il serait intéressant de commencer par laisser une chance pour comprendre comment une langue fonctionne au lieu de s’adonner simplement à la facilité de la proximité. Chaque langue possède ses particularités, et peut-être que l’allemand vous fera réfléchir différemment au monde qui vous entoure… sur ce, auf Wiedersehen!

#babel #linguistique #allemand #allemagne #german #germany

PARLER UNE LANGUE SANS SON

Le 23 septembre dernier s’est déroulée la première journée mondiale de la langue des signes. Cet article sort malheureusement un peu en retard par rapport à l’événement mais il me semblait intéressant de revenir sur ces langues que l’on discrédite souvent parce que le public n’en connaît pas grand-chose. Comme à notre habitude, nous allons décrire la situation telle qu’elle est réellement et tordre le cou à quelques idées reçues.

Pour la majorité de la population, la parole est un des moyens les plus utilisés pour transmettre une idée ou une information. L’écrit est important également, mais dans une conversation en face à face, l’oral va primer sur les écrits ou même les gestes. Pourtant, près de 400 000 personnes en France (soit 0,6% de la population) ne peuvent pas communiquer aisément par voie orale : la plupart de ces personnes sont sourdes, et elles ne peuvent pas recevoir ces sons ; certaines d’entre elles sont muettes, et une minorité d’entre elles sont à la fois sourdes et muettes.

On regroupe souvent abusivement les sourds et les muets dans la même catégorie (on parle alors de sourds-muets), bien que la plupart des muets peuvent entendre ce qu’on leur dit, et que la plupart des sourds peuvent prendre la parole. Dans ce dernier cas, ils n’entendront pas ce qu’ils disent mais peuvent percevoir les vibrations de leur voix, ou apprendre par mimétisme en regardant des personnes entendantes parler. Certaines personnes sourdes apprennent d’ailleurs par la même occasion à lire sur les lèvres pour pouvoir comprendre les entendants, même si la réalisation de certains phonèmes est difficile à différencier pour elles (par exemple, avoir du mal à faire la différence entre /m/ ou /b/ ou /p/, car les trois consonnes sont bilabiales). On peut alors accompagner le son d’un geste pour aider l’interlocuteur à faire la différence entre ces sons qui se ressemblent pour lui : c’est ce qu’on appelle la langue française parlée complétée, ou encore le code LPC.

Cependant, un autre moyen de communication que les personnes sourdes développent naturellement est l’utilisation des mouvements du corps, des mains et de l’expression corporelle et faciale pour transmettre des informations. C’est la fameuse langue des signes. Ou plutôt, une langue des signes, car le langage émerge naturellement et indépendamment dans chaque communauté sourde, et à l’instar des langues orales, il en existe un grand nombre en fonction des pays, réparties en plusieurs familles ayant un ancêtre commun. Elles évoluent et se diversifient, et on compte aujourd’hui six grandes familles : la famille du français, la famille de l’allemand, la famille britannique, la famille du japonais, la famille lyonnaise, et la famille de l’arabe. Il existe également des langues que l’on ne peut relier à aucune autre, et qui fonctionnent donc en indépendance.

Comme on l’a dit, une langue des signes apparaît spontanément dans une communauté sourde, mais le manque de moyen de communication avec les entendants (et le manque d’intérêt de certains d’entre eux) laissent à penser pendant des siècles que les sourds sont simples d’esprit. Même si certains penseurs étudient la complexité de ces langues et la communication entre personnes sourdes bien avant cela, c’est à la fin du XVIIIe siècle que la langue des signes française (ou LSF) va commencer à se standardiser, avec l’invention en 1771 de la première institution éducative gratuite pour sourds à Paris par l’Abbé de l’Épée. Un alphabet dactylologique (utilisant les mains pour symboliser les lettres) est inventé pour aider à épeler les mots du français oral en LSF, et la langue signée va hériter de cela des signes et des tournures de phrases du français. Aujourd’hui encore, un grand nombre de mots en LSF utilisent le signe de la première lettre du mot français correspondant (comme le mot « vacances », où l’on croise les bras et l’on vient tapoter deux fois ses épaules avec les mains en position « V »).

L’alphabet dactylologique de la LSF, d’après Albert Tabaot

J’en parle depuis tout à l’heure comme si c’était une évidence, mais la LSF et le français oral sont deux langues complètement différentes : même si certains concepts sont communs, elles n’ont pas la même origine, ni le même vocabulaire, la même syntaxe ou la même grammaire. Une personne sourde parlant la LSF et le français est alors autant bilingue qu’une personne entendante parlant le français et l’allemand : certains parlent très bien le français et l’écrivent à merveille, d’autres ont un peu plus de mal car il ne s’agit généralement pas de leur langue maternelle.

Justement, parlons grammaire et syntaxe : la LSF est une langue plutôt analytique et isolante, il existe peu de termes genrés (« coiffeur » et « coiffeuse » se diront de la même manière, et pour distinguer on pourra préciser « coiffeur homme » ou « coiffeur femme »), la plupart des noms ont une forme identique au singulier et au pluriel, et le verbe ne se conjugue pas en fonction des personnes. Si comme on l’a dit il existe un alphabet de 26 signes pour représenter les lettres de l’alphabet latin utilisées en français, la LSF les utilise peu et il faut apprendre des centaines de signes différents qui représentent chacun un mot ; c’est en fait assez analogue au japonais, où il existe deux syllabaires (les katakana et les hiragana) mais où il faut apprendre des milliers de symboles différents pour la plupart des mots ; cependant, l’analogie ne s’arrête pas là, puisque comme on l’a dit plus tôt, certaines « clés » ou « positions » des mains permettent de donner des indications sur le mot que l’on signe, et que la plupart des mots se font en un seul signe. La LSF joue également sur les sous-entendus et le non-dit de la conversation : « maison manger » peut vouloir dire « je mange à la maison » ou « il mange à la maison » (ou autre) selon le contexte.

Du point de vue de sa syntaxe, la LSF s’organise de deux manières différentes : dans le temps, et dans l’espace. Dans le temps, c’est l’ordre dans lequel vont être formulés les éléments de la phrase ; et contrairement à la plupart des langues dont nous avons parlé jusque maintenant, la LSF ne respecte par le modèle S/O/V, mais base sa syntaxe dans l’ordre suivant des éléments : lieu/moment/sujet/action ou moment/lieu/sujet/action ; on peut retenir cet ordre en imaginant que l’on met en scène l’action que l’on raconte : où se passe la scène ? à quel moment ? une fois le décor planté, qui est sur les lieux ? et que fait-il ? Dans l’espace, c’est comment la gestuelle et la mise en scène vont être utilisées pour exprimer la phrase ; si l’on rapporte la conversation de deux personnes, il va falloir les identifier dans l’espace, dire où ils sont physiquement dans notre phrase, et se mettre à cet endroit, tourné vers l’autre personnage, pour rapporter ses paroles ; on devra ensuite changer de place et de position pour rapporter les paroles de l’autre personne, un peu comme du théâtre ; la LSF transmet également les informations temporelles de manière spatiale : ce qui est signé au niveau du locuteur correspond au présent, ce qui est derrière lui correspond au passé, et ce qui est devant lui correspond à l’avenir.

Au vu de ces différences, il n’est pas étonnant que les entendant apprenant la LSF aient du mal à formuler leurs phrases, car il s’agit d’un système de transmission de l’information totalement inédit. Ainsi, il n’est pas rare de voir certaines personnes utiliser les mots de la LSF, mais d’avoir une syntaxe plus proche de celle du français : c’est ce qu’on appelle le français signé. Cette tendance quasi-naturelle à utiliser du français signé par les personnes entendantes parlant la LSF explique pourquoi il est recommandé d’avoir des professeurs sourds (natifs LSF) pour enseigner aux jeunes sourds, afin de leur éviter par mimétisme un mauvais apprentissage de leur langue.

Maintenant que nous avons examiné un peu plus en détails la LSF, revenons au début du XIXe siècle alors qu’elle commençait ses premiers balbutiements. En 1815 Laurent Clerc, ancien élève de l’Abbé de l’Épée, rencontre le pasteur américain Thomas Gallaudet, qui était venu en France découvrir de nouvelles méthodes d’enseignement pour les sourds, et accepte de fonder avec lui l’American School for the Deaf (École Américaine pour les Sourds) à Hartford, dans le Connecticut en 1817. Clerc y enseignera la langue des signes française de l’époque (également appelée vieille langue des signes française) qui, mélangée aux autres langues des signes parlées sur le continent américain à cet époque, donnera les bases de la langue des signes américaines (ou ASL, pour American Sign Language). Aujourd’hui, la LSF et l’ASL partagent encore 60% de vocabulaire apparenté, dont les mots ne sont pas forcément identiques mais reconnaissables par un locuteur de l’autre langue. La langue des signes britannique (ou BSL, pour British Sign Language) faisant partie d’une autre famille de langues (ayant évoluée suite aux travaux de Thomas Braidwood à Édinbourg en 1760, similaires à ceux de l’Abbé de l’Épée en France), il est donc (paradoxalement pour nous autres entendants) plus difficile pour une personne sourde américaine parlant l’ASL de comprendre une autre personne sourde britannique, que de comprendre une personne française parlant la LSF.

La LSF (ou la vieille LSF pour être plus précise) a également influencé ou évolué pour donner les langues des signes autrichienne, hongroise, tchèque, néerlandaise, russe, québécoise (par l’intermédiaire de l’ASL), italienne, suisse, irlandaise, grecque, nigérienne, marocaine, algérienne, mexicaine et roumaine (liste non-exhaustive). La BSL est quant à elle à l’origine de la famille des langues des signes parlées dans les anciennes colonies britanniques et l’actuel Commonwealth : australienne, néo-zélandaise, sud-africaine ou indienne. Les autres familles de langues sont moins diversifiées : la langue des signes allemande a également donné les langues polonaise et israélienne ; la langue des signes japonaise est liée aux langues taïwanaise et coréenne ; la famille des langues des signes arabes (dont l’ancêtre commun n’est actuellement pas prouvé) contient également les langues égyptienne, irakienne, libanaise et syrienne ; la langue des signes lyonnaise, considérée comme un isolat par Wittmann, a aujourd’hui évolué pour également donner la langue belge et ses deux dialectes, le francophone et le flamand.

Bien que ces langues soient par leur nature très compliquées (pour ne pas dire impossible) à écrire, elles restent des sujets d’étude fascinants, et j’espère avoir pu vous les faire découvrir et peut-être défait les a priori que vous aviez à leur sujet. Je pense reprendre un jour l’apprentissage de la LSF, mais en attendant, d’autres langues méritent que je parle d’elles…

#babel #linguistique #langue des signes #sign language #asl #lsf

LA LANGUE VULGAIRE

Il est important de noter que dans nos vies, nous avons beau (pour la plupart) parler la même langue au cours de la journée et de nos activités, nous n’utilisons pas cette langue de la même manière en fonction de qui nous avons en face de nous : nous alternons les « registres de langue » et parlons de manière plus formelle à notre employeur ou à une collègue avec laquelle nous avons peu d’affinités, alors que notre façon de parler va être plus « décontractée » avec notre famille ou nos amis proches.

Ainsi, nous pourrions dire que nous parlons plusieurs dialectes d’une même langue en fonction de notre entourage social, vu qu’effectivement ces différents registres de langue sont inter-compréhensibles car ayant pour base la même langue, mais certains éléments de vocabulaire ou de grammaire y différeront (emplois privilégiés de certains noms dans le langage soutenu là où les synonymes du langage courant sembleraient déplacés, formulation d’un niveau de politesse…). On parle alors de sociolecte, littéralement le « dialecte social ».

Mais si ce que nous appelons le langage soutenu est très codifié et documenté, notamment parce qu’il est le sociolecte majoritairement utilisé dans les courriers ou les communications écrites (comme ces articles, qui conservent un certain niveau de rigueur du français et ne représentent pas la manière dont je m’exprime à l’oral), qu’en est-il du langage familier, courant, populaire ou vulgaire ? Quel que soit le nom qu’on lui mette dessus, est-il régi par des règles, est-il plus flexible ?

Tout d’abord, l’expression langage courant désigne le plus souvent le français standard, qui n’est pas forcément soutenu mais qui s’emploie dans la plupart des occasions. Il est donc une sorte d’intermédiaire entre le langage soutenu et celui que l’on peut qualifier de familier (sous-entendu celui que l’on parlerait avec sa famille, c’est-à-dire sans retenue sociale), de populaire (du latin pŏpŭlus « peuple », attesté en 1200 en ancien français sous la forme populeir) ou de vulgaire (du latin vulgus « le commun des mortels » ou « la foule » et ayant pris son sens péjoratif par le regard porté par les classes sociales supérieures sur le bas-peuple ; à comparer avec le verbe vulgariser qui veut dire « rendre la connaissance accessible à tous »). Ces expressions désignent donc quant à elles le langage du peuple, supposé non-éduqué, et parlant de manière plus grossière et sans tenir compte des tabous sociaux ou des règles de bienséance.

Il faut bien noter que le langage populaire ou vulgaire n’existe pas : il y en a un certain nombre, vu qu’il s’agit de sociolectes et qu’ils varient donc en fonction des groupes sociaux qui se forment dans le peuple. Parler un sociolecte peut être un signe de vouloir s’intégrer au groupe social en question, et ne pas le comprendre peut être un signe de rejet, de sa part ou de celle du groupe. C’est ainsi qu’en fonction des lieux, des époques et des groupes, émergent plusieurs jargons ou argots (jargon désigne à partir du XIIIe siècle le parler des personnes en marge de la société, puis a laissé ce sens au mot argot vers le XVIIIe siècle, évoluant pour aujourd’hui signifier le sociolecte d’une profession) : le louchébem a émergé au début du XIXe siècle, puis les écoles supérieures ont développé leur argot dès les années 1880, l’anglais a vu au début du XXe siècle apparaître un argot à rimes, le verlan a pris son essor dans les années 1950 et s’est aujourd’hui très diversifié, et même internet possède son propre argot.

Le louchébem est le parler des bouchers de Paris et de Lyon, apparu dans la première moitié du XIXe siècle : son but est d’empêcher la compréhension de certains mots aux personnes non-initiées, qui peut également être un des buts premiers des jargons et argots. La première consonne (ou syllabe dans le cas d’un mot commençant par une voyelle) est rejetée en fin de mot, un « l » est rajouté à l’initial, et un suffixe est ajouté pour travestir encore plus le mot : ainsi, boucher devient ouchéb après la première étape (l’orthographe varie, mais est souvent notée de manière phonétique), puis louchéb après la deuxième, et enfin louchébem après la dernière. Certains mots du louchébem sont passés dans d’autres argots, comme en loucedé « en douce » ou à loilpé « à poil » (que, personnellement, j’ai plus entendu prononcé à oilpé sans son « l » initial), d’autres ont même perdu leur caractère argotique et sont arrivés en français standard : loufoque correspond au mot « fou » en louchébem. À noter que dans le cas d’à loilpé, l’expression est elle-même originaire de l’argot, « à poil » étant la métaphore pour dire « nu » : c’est donc un autre exemple de va-et-vient linguistique.

Les écoles supérieures (notamment les classes préparatoires aux grandes écoles) possèdent chacune leur vocabulaire spécifique permettant de se différencier et de former un groupe, ce qui peut aider à la cohésion sociale entre étudiants (notamment pour intégrer les premières années tout juste arrivées dans le cercle de l’école) : les prépas ou « écoles préparatoires » littéraires sont appelées d’abord cagnes en référence à la déformation physique des genoux cagneux, puis l’orthographe est changée en khâgne pour paraître plus savante, et ses étudiants sont donc des khâgneux ; on parle d’hypokhâgneux si l’étudiant est en première année, de carré (ou khârré) si l’étudiant est en deuxième année pour la première fois, et de cube (ou khûbe) si l’étudiant redouble sa deuxième année ; dans le domaine scientifique, les équivalents sont les taupes pour les écoles (par analogie aux taupes restant sous terre la majorité du temps, les étudiants passant la plupart de leur année à travailler ou réviser et « voient peu souvent la lumière du jour »), de taupin pour les étudiants, et de 1/2, 3/2, et 5/2 respectivement pour les étudiant de première année, de deuxième année, et de redoublant en deuxième année (la raison derrière ces noms est un jeu de mot sur la phrase « intégrer X », ayant un sens mathématique que je ne développerai pas ici, et X étant également en prépa scientifique le surnom de l’école Polytechnique, l’une des écoles les plus prestigieuses (si ce n’est la plus prestigieuse)).

En anglais, la banlieue est de Londres a vu naître entre 1880 et 1920 un argot à rimes (rhyming slang en anglais), cherchant lui aussi à empêcher la compréhension de la conversation par les non-initiés : le mot en question va dans un premier temps être remplacé par un autre mot rimant avec lui, puis cette rime va être associée à un mot lui étant apparenté par le sens, avant d’être supprimée pour ne garder que le mot apparenté. Par exemple, telephone « téléphone » rime avec bone « os », bone va être associé à dog « chien » pour former l’expression dog and bone, puis bone va être délaissé et l’expression argotique dog voudra donc dire telephone ; stairs « escaliers » rime avec pears « poires », pears va être associé à apples « pommes » pour former apples and pears, puis l’expression argotique deviendra apples pour désigner stairs… pas simple ! Surtout que, vous le remarquerez aisément, le mot argotique n’a souvent pas le moindre rapport avec son signifié.

Le verlan est l’un des phénomènes linguistiques les mieux connus par la jeune génération en français : comme son nom l’indique, il consiste à inverse l’ordre des syllabes d’un mot, le plus souvent lorsqu’il est court (une ou deux syllabe), comme si le mot était prononcé à l’envers (d’où verlan « (à) l’envers »). L’opération s’appelle en linguistique une métathèse. On ne compte plus le nombre de mots en verlan utilisés dans le language familier par de nombreux sociolectes : aç « ça » (dans l’expression comme aç), teuf « fête », chelou « louche », zarbi « bizarre », ouf « fou », cimer « merci », turfu « futur », beur « arabe »… mots qui ont parfois une forme en verlan assez ancienne pour qu’on ignore au premier abord son origine : barjo est le verlan de jobard, terme argotique désignant un « simple d’esprit » !

Certains mots ont également subi au cours de leur évolution une apocope (la perte de phonèmes en fin de mot), comme le mot d’argot flic « policier », devenu dans un premier temps keufli, puis keuf par apocope du « li », ou le mot feuj « juif ». D’autres mots existent également sous une deuxième forme en verlan, correspondant à un verlan de la forme déjà existante en verlan : beur « arabe » a de nouveau subi une métathèse pour devenir rebeu. À noter également que les verbes en verlan ne se conjuguent pas et restent invariables : leur usage est donc restreint à certains temps comme l’indicatif présent, l’infinitif, le participe passé ou l’impératif.

L’usage du verlan a été majoritaire dans les banlieues moins favorisées dès son apparition dans les années 1950, bien que son usage se soit démocratisé aujourd’hui. C’est également dans les banlieues et les cités que l’argot contemporain se développe, avec énormément d’emprunts aux langues des familles d’immigrés : arabe (miskin « idiot, pauvre type »), tzigane (marav « battre, frapper »), wolof (go « fille, copine »)…

Enfin, pour terminer cet article, je ne ferai que mentionner l’argot d’internet, qui s’est énormément développé sur les quinze dernières années et qui présente nombre d’abréviations (tout comme le langage SMS), souvent issues de l’anglais : wtf? pour what the fuck ? « c’est quoi ce bordel ? », afk pour away from keyboard « loin du clavier »… parfois directement en français, comme màj pour « mise à jour », dsl pour « désolé », vdm pour « vie de merde »… Si vous naviguez sur internet comme moi, vous devez connaître un peu cet univers et son jargon. À noter que les termes geek et hackeur par exemple, bien que relevant du domaine internet et décrivant des concepts lui étant associés, se développent également en dehors et se démocratisent.

Ainsi, que peut-on retenir ? Que les règles qui forgent le langage familier sont parfois complexes, bien plus qu’on ne peut l’imaginer. Qu’elles existent et qu’elles sont différentes du français standard ou soutenu. Et que comme dans tous cas d’interaction entre deux langues ou deux dialectes, les différentes cultures s’alimentent l’une l’autre. La langue vulgaire doit certains de ses mots et expressions à la langue française standard, peut-être ; mais le français standard a également beaucoup emprunté à la langue vulgaire, et parfois sans qu’on s’en rende bien compte…

#babel #linguistique #verlan #vulgaire #familier #argot #jargon #louchebem

QU’EST-CE QU’UN CREOLE ?

Parmi les langues pouvant émerger très rapidement, il nous faut rajouter une double catégorie : les pidgins d’une part et les créoles d’autre part. Mais si pour certaines personnes peu renseignées, ces langues peuvent sembler être des versions « simplifiées » ou « fausses » de langues déjà existantes comme le français ou l’anglais, il n’en est rien : c’est au contraire un univers complètement différent de règles et de postulats qui s’ouvre à nous.

Commençons par le commencement : un pidgin est une langue qui peut apparaître et se développer en une génération voire moins, mettant entre 10 et 25 ans à être complètement développée. Elle n’a pas de locuteurs natifs (c’est-à-dire de personnes naissant et parlant cette langue comme langue maternelle), parce qu’elle se développe dans une communauté ayant peu ou aucune langue en commun et avec un objectif de communication rapide : c’est donc une lingua franca. Elle n’est cependant pas considérée comme une langue artificielle, du fait qu’elle n’est pas la vision ou l’invention d’un groupe restreint de personne. Elle reste tout de même à part de la majorité des langues naturelles pour les raisons que nous allons citer par la suite.

Ne nous mentons pas : même si des exceptions à ce modèle existent, les pidgins se sont énormément développés pendant la période coloniale, que ce soit avec l’occupation des territoires indigènes ou l’esclavage, notamment la Traite des Noirs aux XVIIe et XVIIIe siècles. Les besoins de communication précédemment cités sont donc en grande partie un besoin de vocabulaire commun pour le travail entre esclaves de différentes communautés linguistiques, ainsi que pour la communication avec les colons, et le peu de langue en commun de ces populations s’explique du fait que les européens séparaient les esclaves parlant la même langue pour éviter les rébellions et les échanges dans des langues qu’ils ne pouvaient pas comprendre.

Un pidgin a donc plusieurs langues naturelles pour base : le vocabulaire est en grande partie issu de la langue coloniale (appelée également la langue de superstrat ou langue « dominante »), comme le français, l’anglais ou l’espagnol, et est déformé pour s’adapter au système phonétique des langues parlées par les locuteurs (ou langues de substrat) ; une partie de ce vocabulaire est cependant emprunté à ces langues de substrat, tout comme la syntaxe, la grammaire et la conjugaison ; la population de la langue de superstrat (dans notre cas, les colons) ne cherchant pas à apprendre la ou les langues de leurs esclaves, et leur dispensant une éducation très rudimentaire (pour peu qu’elle soit effectivement dispensée), la grammaire et la conjugaison de la langue dominante n’aura que très peu de chance d’être intégrée par les esclaves. Ajoutons à cela le fait que le but premier de la communication soit centré sur le travail, et l’on voit pourquoi l’on dit que les pidgins sont à l’origine des langues appauvries, instables.

Il faut attendre que le pidgin soit parlé dans toutes les situations de la vie de tous les jours, et non plus uniquement dans les situations de travail, pour qu’il remplace la langue maternelle des populations esclaves et qu’il s’enrichisse de nouveau vocabulaire et se stabilise. S’il survit assez longtemps pour devenir la langue maternelle de la génération suivante, alors le pidgin devient un créole : cette langue peut alors évoluer à son tour comme toute autre langue naturelle, s’éloignant de son passé colonial et embrassant un nouveau pan de complexité. Elle garde toujours un lien avec la langue de superstrat, mais la méthode de création d’un pidgin ainsi que la complexité accumulée dans sa phase de créole expliquent les difficultés de compréhension rencontrées entre locuteurs des deux langues : par exemple, si quelqu’un parlant français peut comprendre le vocabulaire d’un créole à base française, sa syntaxe et sa grammaire risquent d’être le vrai frein à la compréhension du sens de la phrase.

Dans l’imaginaire collectif, les créoles sont souvent considérés comme étant des formes « abâtardies » des langues de superstrat (comme nous l’avons dit en introduction), ou peuvent être socialement associés à un faible statut, la langue de superstrat restant souvent la langue de prestige dans la population (comme à Haïti entre l’indépendance du pays en 1804 et la reconnaissance du créole haïtien comme langue officielle du pays en 1987). Les créoles sont aussi pour beaucoup oraux, la langue de superstrat pouvant servir de norme à l’écrit ou de langue officielle ; cela n’empêche pas ces créoles d’avoir des normes orthographiques et de développer une littérature.

« Konpèr Korbo, anlèr in pyédbwa, Té tyinbo dan son bèk in formaz. Konpèr Ronar, ki té anbèt son bous, La di ali paroli-là » 4 premiers vers de « Lo Korbo ék lo Ronar » (« Le Corbeau et le Renard »), en créole réunionnais

Cependant les différences ou les simplifications de structure cachent une autre manière de penser qui peut ne pas être familière au premier abord. Examinons en exemple quelques aspects du créole haïtien :

le vocabulaire est, comme je le répète depuis le début de l’article, en grande partie issu du français ; cependant, l’orthographe du créole haïtien est standardisée depuis 1979 et est plutôt basée sur la prononciation du mot que son étymologie française ; ainsi, si danse se prononce comme son équivalent français « danser » et reste très évident, mesye « monsieur » est plus abstrait et demande à être prononcé pour saisir son sens ;

la grammaire a pour base la langue fon du Bénin, qui est une langue isolante, où les mots restent invariables en genre, personne, nombre et cas (ce qui n’est pas le cas du français) ; ainsi, le créole haïtien possède le même mot pour « je » et « moi », mwen ; le verbe konn « connaître, savoir » est également invariable, mwen konn « je sais », ou konn « tu sais », li konn « il sait »…

de fait, les temps verbaux sont indiqués par différents marqueurs, comme ap (de « après ») pour indiquer l’aspect progressif (mwen pale « je parle », mwen ap pale « je suis en train de parler » ; à comparer avec le québécois où « je suis en train de parler » peut également se dire je suis après parler) ou le futur, fèk (de « fait que ») pour le prétérit, te (de « été ») pour le passé, fòk (de « faut que ») pour le subjonctif…

l’ordre des mots est, comme en fon et en français, SVO ; cependant, et contrairement au français, l’article défini suit le nom en question (liv la « le livre »), tandis que l’article indéfini le précède (yon liv « un livre ») ; les adjectifs suivent souvent le nom qu’ils décrivent ; la possession se forme en accolant le pronom personnel à la suite du possédé (bekann mwen « ma moto », chyen frè mwen « le chien de mon frère ») ;

lors d’une question, l’ordre reste le même, le caractère interrogatif est alors donné par l’intonation, la particule eske « est-ce que », ou un pronom interrogatif comme ki sa « quoi », ki kote « où », poukisa « pourquoi »…

Quelques exemples ne suffisent à faire comprendre la richesse linguistique des créoles, et notre relative ignorance en tant qu’individus des langues africaines sur lesquelles sont basées les grammaires de ces langues ne nous aide pas non plus à les appréhender. Alors surtout, en attendant le prochain article sur le sujet, n’hésitez pas à vous renseigner de votre côté ! Leur origine est lourdement chargée, mais elles sont la preuve vivante que le langage s’adapte à toute situation.

#babel #linguistique #creole #pidgin #haitian

LANGUES ARTIFICIELLES

Dans notre série d’articles sur l’origine des langues, nous avons vu comment les langues évoluaient à travers le temps et nous avons débattu sur la Langue Originelle. Mais à aucun moment nous ne nous sommes demandé : « comment apparait et se crée une langue ? » Je veux dire par là, à la base, sans évoluer d’une langue plus ancienne. Une langue apparait-elle de manière spontanée ? Lui faut-il du temps ? Combien de personnes sont-elles responsables de son invention ?

Pour ce que l’on appelle les langues naturelles, la réponse est, vous vous en douterez, à peu près la même qu’avec l’hypothèse de Babel : à l’heure actuelle, on ne sait pas grand-chose, et il est possible que l’on en sache jamais rien. On suppose que la plupart des langues se sont développées petit à petit, ont été parlées à leur origine par des communautés plus que par des individus, et cela repose donc bien souvent sur son évolution à partir de formes déjà existantes.

Pourtant il existe un cas où l’on peut retracer assez aisément l’origine d’une langue, voir son évolution depuis ses début jusqu’à son stade opérationnel en quelques années, et compter sur les doigts d’une main le nombre de locuteurs originels à qui l’on doit cette langue. C’est le cas des langues construites, également dites langues artificielles, ou idéolangues (les anglophones parleront de conlang pour constructed language « langue construite »).

Cette distinction peut paraître arbitraire, mais les idéolangues ont également une caractéristique commune que n’ont pas les langues naturelles : une motivation derrière la création. Une langue naturelle n’a pas de but lors de son évolution, elle ne fait qu’apparaitre, se développer, potentiellement évoluer, puis décliner et disparaitre. Une langue construite est inventée avec un but, qui peut répondre à plusieurs attentes : faciliter la communication, tester une hypothèse ou mettre en avant un principe, prolonger l’immersion dans un univers de fiction, ou tout simplement créer une langue pour le simple plaisir de la chose.

Si l’une des première idéolangues de l’histoire, la Lingua Ignota de l’abbesse de Rupertsberg, date du XIIe siècle, le mouvement de création de langues prend vraiment de l’ampleur à la fin du XIXe siècle avec le volapük de Schleyer (1879) et l’espéranto de Zamenhof (1887). Tous deux ont créé ce qu’ils voulaient être une langue auxiliaire internationale, c’est-à-dire construite dans un but de neutralité et pour faciliter la compréhension entre individus ne parlant pas la même langue : s’il a été question pendant un temps de faire de l’espéranto une des langues de travail de l’ONU après la Seconde Guerre Mondiale, l’anglais s’est malheureusement vite imposé à la place. Le volapük s’est heurté en à peine une dizaine d’années à la différence de vision de son créateur et de ses utilisateurs, et si le projet était très bien parti au début des années 1880, il reste aujourd’hui moins de 50 personnes parlant couramment le volapük ; l’espéranto quant à lui possède une base de locuteurs plus important (estimée entre 100 000 et 10 millions), mais il n’a pas échappé aux affres de l’évolution et, Zamenhof l’ayant peu réformé, certaines personnes ont alors créé des langues dérivées ayant pour base l’espéranto, comme l’ido, le mondlango ou le neo.

Volapük et espéranto sont deux langues dites construites a posteriori, car elles reposent de base sur des langues (pour leur vocabulaire, leurs racines ou leur grammaire) déjà existantes. Le cas contraire est donc celui des langues construites a priori (ne se basant sur aucune langue déjà existante pour constituer son vocabulaire ou sa grammaire ; les ressemblances sont alors de ce fait des coïncidences). On reproche cela étant souvent au volapük de modifier ses racines (tirées de l’anglais, du latin, de l’allemand et du français en règle générale) de manière trop extrême, empêchant alors une reconnaissance aisée, ou à l’espéranto d’avoir un vocabulaire et un système phonétique trop euro-centré, en faisant une langue supposée mondiale mais plus compliquée à apprendre pour un locuteur natif d’une langue chinoise qu’un européen.

D’autres langues sont construites selon d’autres idéaux : le loglan (1955) et son dérivé le lojban (1987) ont été créés dans le but d’avoir une langue la plus logique possible, et évitant toute ambigüité présente dans les langues naturelles ; elles s’approchent alors plus d’un language que pourrait parler ou comprendre un ordinateur (ou tout du moins un programme) ; dans un autre domaine, le toki pona (2001) ou « langue du bien » en toki pona, a été pensé pour être le plus minimaliste possible et aider la communication en simplifiant la pensée complexe, en la débarrassant de tout ce qui est superflu ; la langue comporte 14 phonèmes (ce qui est très peu !) et un total de 120 mots de base, le reste du vocabulaire pouvant être utilisé en formant des périphrases.

Ensuite, bien sûr, il y a la catégorie des langues de fiction, créées pour servir l’œuvre dans laquelle elles apparaissent et lui donner plus de relief : sans aller jusqu’à dire que J.R.R. Tolkien est à l’origine du mouvement avec ses nombreuses langues pour la Terre du Milieu (le khuzdûl (années 1930), le noir-parler (vers 1940), le quenya (1915) et le sindarin (1917) pour ne citer qu’eux), c’est à lui que l’on pense pour ce qui est des langues de fictions, et c’est dans sa veine qu’apparaîtront diverses langues : le klingon (1985) pour la série Star Trek ; le fourchelang (2002) pour le deuxième film de la saga Harry Potter ; le na’vi (2005-2009) pour le film Avatar de James Cameron ; le dothraki (vers 2009) pour la série télévisée Game of Thrones… la liste est très longue (le site Langmaker en recensait avant sa fermeture plus d’un millier) !

Le plus absurde peut alors sembler être la création d’une langue juste pour le plaisir de créer une langue, mais l’exercice peut apporter des pistes de réflexions intéressantes en linguistique à celui ou celle se lançant dans la pratique : construire une langue viable de A à Z nécessite de se poser de nombreuses questions et d’étudier d’autres langues pour comprendre leur fonctionnement, et mène souvent à une vision complètement différente des langues et des manières dont l’humain transmet une information par les mots. En soi, ce qui semble être un hobby peu commun et parfois très personnel devient, si la tâche est bien menée, une réflexion sur la linguistique, la psychologie et la sociologie… et je ne dis pas ça uniquement pour me rassurer après être tombée dans l’étude de la linguistique à cause dudit hobby !

Certaines de ces langues mériteraient et mériteront leur article à part entière pour les détailler, mais en attendant je vous laisse pour cette semaine, en vous encourageant à continuer et persévérer dans votre projet si vous avez commencé une idéolangue !

#babel #linguistique #conlang #langues construites #idéolangue #esperanto #volapuk

FONCTIONNEMENT DE L’ALPHABET PHONETIQUE

Comme on l’a déjà dit précédemment, la linguistique moderne est née vers la fin du XVIIIe siècle, et il devient alors important de pouvoir documenter les langues étudiées. La question se pose alors dans le courant du XIXe siècle de savoir comment retranscrire les langues n’ayant pas le même système d’écriture que celle du linguistique faisant la documentation, ou n’ayant pas du tout de forme écrite. Dans le même temps, une association de professeurs de langues s’interroge sur la meilleure manière d’enseigner à leurs élèves britanniques la prononciation du français et aux élèves français la prononciation de l’anglais, qui malgré un même alphabet et des proximités, diffèrent énormément.

Ces deux événements en apparence non liés sont pourtant à la base de ce qui permet aujourd’hui de retranscrire toute langue sans ambigüité par et pour des locuteurs de n’importe quelle langue : l’Alphabet Phonétique International (ou API). Je ne rentrerai pas énormément dans les détails de sa genèse et de son évolution aujourd’hui, et me concentrerai sur son fonctionnement et comment le lire. Sachez toutefois que l’API est inspiré de systèmes de transcription phonétique de l’anglais de l’époque (comme l’alphabet romique de 1877 ou le Palaeotype de 1869), et qu’il a été révisé plus d’une vingtaine de fois depuis sa création en 1888, la plus récente datant de 2005.

L’API est, comme son nom l’indique, un alphabet : un symbole va donc représenter un son, que ce soit une consonne ou une voyelle. Il n’existe cependant pas d’ordre alphabétique pour l’API : plutôt qu’en liste, les lettres sont classées dans deux tableaux à double-entrée (un pour les consonnes, l’autre pour les voyelles). Il est important de noter également que chaque lettre ne possède qu’une prononciation, et que chaque son n’est représenté que par une seule lettre.

Théoriquement tout du moins : nous y reviendrons peut-être dans le futur, mais il existe une différence entre la notation phonétique (dite « entre crochets »), qui correspond à la transcription phonétique exacte d’un mot, quelle que soit la langue concernée, et la notation phonologique (dite « entre barres obliques »), qui est une transcription légèrement simplifiée et relative à une langue qui permet notamment la production d’allophones ; la notation phonologique étant par définition plus large dans ses possibilités que la notation phonétique, on retrouve également dans la littérature anglophone les termes de narrow transcription « transcription étroite » pour la notation entre crochets et broad transcription « transcription large » pour la notation entre barres obliques. Par exemple, le mot anglais tolerate « supporter » peut s’écrire /ˈtɒl.ə.ɹeɪt/ en transcription large, tandis qu’une réalisation en notation phonétique sera plutôt notée [ˈtʰɒˑləɹeɪtʔ].

Revenons maintenant aux lettres de l’API : elles peuvent chacune être décrites par quatre termes, le premier étant le type de son (consonne ou voyelle). Ensuite, pour les voyelles, on décrira la lettre par :

son degré d’aperture : une voyelle ouverte nécessitera une ouverture du canal vocal importante pour être réalisée, tandis qu’une voyelle fermée se fera avec la langue très proche du palais ; entre ces deux extrêmes, on trouvera les voyelles pré-ouvertes, mi-ouvertes, moyennes, mi-fermées et pré-fermées, toutes dénotant un rapprochement de la langue vers le palais plus important que la précédente ;

son point d’articulation : une voyelle antérieure sera produite avec la langue à l’avant de la bouche, tandis qu’une voyelle postérieure sera réalisée avec la langue le plus loin possible à l’arrière de la bouche ; la plupart des voyelles produites dans les langues sont antérieures ou postérieures, mais il existe certaines voyelles centrales, avec la langue située entre l’avant et l’arrière de la bouche, et quelques rares voyelles quasi-antérieures et quasi-postérieures ;

son caractère de rondeur : une voyelle peut soit être arrondie, c’est-à-dire que les lèvres sont arrondies pour la produire, soit être non-arrondie, c’est-à-dire que les lèvres ne sont pas arrondies pour la produire (ce qui semble évident).

Pour un même degré d’aperture et un même point d’articulation, il existe deux voyelles qui diffèrent seulement par leur caractère de rondeur : comparez les voyelles [i] et [y], qui correspondent en français aux sons notés « i » et « u », et vous constaterez qu’elles partagent le même degré d’aperture (fermées) et le même point d’articulation (antérieures), mais que [i] est non-arrondie là où [y] l’est. On appellera donc [i] la voyelle fermée antérieure non-arrondie et [y] la voyelle fermée antérieure arrondie.

Quant aux consonnes, on pourra décrire la lettre par :

son mode d’articulation : il existe 14 modes d’articulations différents pour une consonne, que nous allons devoir décrire car leur nom ne décrit pas forcément explicitement leur réalisation : * nasale : écoulement du flux d’air par la cavité nasale, pratiquement toujours accompagné d’une occlusion brusque et temporaire du canal buccal ; * occlusive : fermeture du canal vocal et un relâchement soudain de ce blocage ; * fricative : rétrécissement fort du canal vocal sans pour autant le fermer totalement, donnant une impression de friction auditive ; * spirante : rapprochement modéré des organes phonateurs qui ne va pas jusqu’à produire le bruit caractéristique de friction des fricatives ; on parle parfois (surtout en littérature anglophone) d’approximante ; * roulée : vibrations multiples et rapides entre le lieu d’articulation et la langue ; on parle aussi de trillée * battue : proche d’une occlusive, il n’y a cependant pas ici de pression de l’air ; elle peut également ressembler à une roulée mais « ne roulant qu’une seule fois » ; * toutes les modes d’articulations décrits pour l’instant sont centraux, c’est-à-dire que l’air passe par le centre du canal vocal ; les fricatives, spirantes et battues ont également un équivalent latéral : l’air passe par les côtés du canal vocal plutôt que par le centre ; * tous les modes d’articulation décrits plus haut sont pulmoniques, c’est-à-dire qu’il y a un écoulement d’air entre les poumons et le canal vocal par les cordes vocales ; il existe 5 types de consonnes non-pulmoniques, c’est-à-dire où l’air va être stocké dans un temps entre les lèvres et les cordes vocales, puis relâché sans que les cordes vocales ne s’ouvrent et que l’air ne vienne des poumons ; il s’agit des occlusives injectives ou implosives (réalisées avec un abaissement de la glotte légèrement avant l’occlusion, donnant l’impression que l’air « rentre » dans la bouche), des occlusives et fricatives éjectives (réalisées avec une remontée du larynx, donnant l’impression que l’air est « expulsé » de la bouche), ainsi que des clics centraux et latéraux ; dans le cas des clics, on va souvent omettre le terme de consonne pour les décrire, et le remplacer de ce fait par clic.

son point d’articulation : il existe 12 points d’articulations différents pour une consonne, classés depuis les lèvres puis en remontant jusqu’à la glotte : * bilabiale : utilisant les deux lèvres ; * labio-dentale : utilisant les dents de la mâchoire inférieure contre la lèvre supérieure ; * dentale : utilisant la pointe de la langue contre les l’arrière des dents ; * alvéolaire : utilisant la pointe de la langue contre les alvéoles, région de la bouche entre les dents et la partie dure du palais ; * palato-alévéolaire ou post-alvéolaire : faisant un point de pression de la langue entre les alvéoles et le palais dur ; * rétroflexe : pour lesquelles la pointe de la langue se recourbe vers l’arrière de la bouche ; * palatale : faisant un point de pression de la langue contre le palais dur ; * vélaire : faisant un point de pression de la langue contre le velum, le palais mou à l’arrière de la bouche ; * uvulaire : faisant un point de pression de l’arrière de la langue près de la luette ; * pharyngale : faisant un point de pression de l’arrière de la langue au niveau du pharynx ; * épiglottale : faisant un point de pression au niveau du pharynx avec l’épiglotte ; * glottale : faisant un point de pression au niveau de la glotte.

sa phonation : une consonne peut soit être sonore, c’est-à-dire que les cordes vocales vibrent pour la produire, soit être sourde, c’est-à-dire que les cordes vocales ne vibrent pas pour la produire.

Pour une même manière et même point d’articulation, il existe en général deux consonnes qui diffèrent seulement par leur phonation : comparez les consonnes [ʃ] et [ʒ], qui correspondent en français aux sons notés « ch » et « j », et vous constaterez qu’elles partagent la même manière d’articulation (fricatives) et le même point d’articulation (palato-alvéolaires), mais que [ʃ] est sourde là où [ʒ] est sonore. On appellera donc [ʃ] la consonne fricative palato-alvéolaire sourde et [ʒ] consonne fricative palato-alvéolaire sonore.

Certaines consonnes possèdent également deux points d’articulation, qui nécessitent donc des points de pression simultanés : comme [w] ou « consonne approximante labio-vélaire voisée ». Il existe également pour les voyelles comme pour les consonnes des diacritiques permettant de modifier légèrement la lettre : nasalisation, labialisation, voisement, dévoisement, aspiration, rhotacisation (modifier la prononciation pour la rapprocher d’un [r])…

Ainsi, même sans connaître le symbole d’une lettre, si l’on connaît sa description de l’API on peut bien la reproduire phonétiquement. Apprendre à le lire peut aider énormément et accélérer la lecture du rendu phonétique, mais j’espère au moins qu’à partir de maintenant vous comprendrez son fonctionnement. On se retrouve la semaine prochaine pour un article un peu moins « liste de définitions » et plus informatif, mais il fallait passer par ces explications !

#babel #linguistique #api #consonne #voyelle #alphabet #phonetique

LA TOUR DE BABEL & LA LANGUE ORIGINELLE

« Toute la terre avait une seule langue et les mêmes mots. Comme ils étaient partis de l’orient, ils trouvèrent une plaine au pays de Schinear, et ils y habitèrent. Ils se dirent l’un à l’autre : Allons ! faisons des briques, et cuisons-les au feu. Et la brique leur servit de pierre, et le bitume leur servit de ciment. Ils dirent encore : Allons ! bâtissons-nous une ville et une tour dont le sommet touche au ciel, et faisons-nous un nom, afin que nous ne soyons pas dispersés sur la face de toute la terre. L’Éternel descendit pour voir la ville et la tour que bâtissaient les fils des hommes. Et l’Éternel dit : Voici, ils forment un seul peuple et ont tous une même langue, et c’est là ce qu’ils ont entrepris ; maintenant rien ne les empêcherait de faire tout ce qu’ils auraient projeté. Allons ! descendons, et là confondons leur langage, afin qu’ils n’entendent plus la langue, les uns des autres. Et l’Éternel les dispersa loin de là sur la face de toute la terre et leur donna tous un langage différent ; et ils cessèrent de bâtir la ville. C’est pourquoi on l’appela du nom de Babel, car c’est là que l’Éternel confondit le langage de toute la terre, et c’est de là que l’Éternel les dispersa sur la face de toute la terre. » extrait du Livre de la Genèse, chap. 11, vers. 1-9

Ce mythe rapporté dans l’Ancien Testament est l’explication biblique à la divergence des langues parlées à travers le monde, ainsi que l’origine du nom de ce blog et de celui de l’hypothèse dont nous allons parler aujourd’hui : l’hypothèse de Babel, ou « l’humanité a-t-elle eu une langue originelle ? ».

Étymologiquement, le nom « Babel » vient, selon la tradition biblique, de l’hébreu בלבל blbl, « confondre », d’après le neuvième verset cité précédemment. Il est également possible que le nom vienne de l’akkadien, une autre langue sémitique parlée jusqu’au VIIIe siècle av. EC, où Bāb-Ilum signifie « Porte de Dieu ». Babel est également appelée Babylone (dont le lien avec Bāb-Ilum est plus facile à retracer).

Nous avons vu la semaine dernière qu’il était possible de retracer les protolangues à partir des langues descendantes documentées ou encore parlées. On peut alors distinguer pour l’instant une quinzaine de familles linguistiques différentes (dont les langues indo-européennes, les langues afro-asiatiques, les langues sino-tibétaines…) ayant chacune sa langue d’origine et une aire de diffusion d’origine (le PIE, le proto-afro-asiatique, le proto-sino-tibétain…). La question que l’on se pose alors est : qu’est-ce qui nous empêche de recommencer et de comparer les protolangues entre elles pour chercher des similitudes, des changements réguliers et consistants, et créer des superfamilles de langues ?

Grandes familles linguistiques reconnues aujourd’hui d’après « Familles de langues du monde légendé », par Aucassin, CC-BY-SA

Certains linguistes se sont essayés à la tâche, notamment Joseph Greenberg au XXe siècle. Sont alors apparus des superfamilles aujourd’hui acceptées (donc les langues afro-asiatiques citées précédemment), d’autres faisant encore débat entre les spécialistes (comme les langues nilo-sahariennes, acceptées comme étant une famille linguistique de manière générale, ou les langues khoisan, regardées encore par la majorité des linguistes comme une famille issue d’un regroupement géographique plutôt que d’une évolution génétique), et certaines complètement rejetées (la famille des langues amérindes proposée en 1987 et regroupant ensemble la quasi-totalité des langues autochtones des Amériques). Greenberg utilisa la technique de la comparaison de masse, classant les langues dans un premier temps selon des motifs récurrents dans leur vocabulaire et leur typologie et utilisant par la suite les outils de comparaison linguistique.

Dans les années 1990, il proposa la famille des langues eurasiatiques pour regrouper : les langues indo-européennes, les langues ouraliennes, la famille altaïque déjà controversée, la famille géographique des langues paléosibériennes (appelées dans une hypothèse de lien génétique les langues tchouktches-kamtchadales), les langues eskimo-aléoutes, ainsi que le coréen, le japonais, l’aïnou, l’étrusque et le nivkh. En 2008, Bomhard émit l’hypothèse que les langues eurasiatiques ne soient qu’une sous-famille d’un groupe plus grand, les langues nostratiques, incluant également les langues afro-asiatiques, les langues dravidiennes, l’élamite, le sumérien et le youkaguir ; le proto-nostratique daterait alors d’entre 15.000 et 12.000 av. EC, vers la fin de la dernière glaciation (l’hypothèse nostratique est cependant ancienne et remonte au début du XXe siècle).

En 2007, Ruhlen utilise la comparaison de masse et publie une structure généalogique de toutes les langues humaines parlées en sept niveaux, remontant jusqu’au proto-sapiens, aussi appelé proto-monde ou proto-humain :

Théorie de la langue mère unique de Ruhlen, 2007

On pourrait alors se dire que l’on a répondu à la question : voici la langue originelle, et ses différents embranchements jusqu’aux langues d’aujourd’hui ! Sauf que la solution est rarement aussi simple… la comparaison de masse est très controversée en linguistique, et si elle a apporté des pistes de réflexion et des études qui ont été approuvées par des moyens plus conventionnels par la suite, elle reste considérée comme un grand « non » pour les études sérieuses et revues par un plus grand nombre de pairs. Le meilleur outil à notre disposition est donc encore à l’heure actuelle la linguistique comparée, mais cette dernière ne fonctionne bien que sur des petites échelles de temps, entre 6.000 et 8.000 ans ; pourtant certaines des langues proposées par la comparaison de masse datent d’il y a 20.000 voire 200.000 ans. Les changements s’accumulant pendant ce temps peuvent complètement transformer deux langues peut-être apparentées par le passé mais ne se ressemblant aujourd’hui plus du tout, sans compter pendant ce temps les effets de Sprachbund et les échanges linguistiques entre communautés non-apparentées génétiquement.

Alors revenons à la question de base, l’hypothèse-même derrière l’histoire de la Tour de Babel : y a-t-il eu une unique langue parlée dans le monde ? La réponse peut paraître un peu décevante : on ne sait pas. Peut-être qu’il a existé par le passé une protolangue à l’origine de toutes les langues référencées aujourd’hui. Peut-être qu’il s’agissait même de la première langue de l’humanité. Ou bien peut-être que le langage a évolué et s’est développé plusieurs fois dans l’espèce humaine et à travers le globe de manière indépendante. Et quand bien même, si cette protolangue avait réellement existé, que pourrait-on dire sur elle ? Elle utilisait sûrement des consonnes et des voyelles formées grâce à la langue, avait un inventaire d’entre 10 et 100 phonèmes, lesquels formaient des syllabes et des mots … des généralités tellement simples qu’elles en sont décevantes mais qui sont, effectivement, les rares points communs de la quasi-totalité des langues parlées encore aujourd’hui.

Ainsi, l’hypothèse de Babel est-elle vraie ? Nous n’en savons, à l’heure actuelle, rien ; et il est malheureusement probable que nous n’en sachions jamais rien, du fait même de l’évolution linguistique et du caractère fini de l’Histoire (au sens période depuis l’invention de l’écriture). Cela ne veut pas dire que nous n’avancerons pas plus dans le domaine de la recherche sur l’origine et l’évolution du langage, loin de là (la neurolinguistique, avec les applications des sciences modernes, est encore une branche jeune et prometteuse) ! Seulement, il faut peut-être admettre que certaines choses échapperont toujours à notre connaissance, et que certaines histoires sont plus jolies quand on ne s’intéresse pas à savoir si elles sont vraies…

#babel #linguistique #origine

COMMENT GROUPE-T-ON LES LANGUES ?

La semaine dernière nous avions vu que le proto-indo-européen, la langue à l’origine de la majorité des langues actuellement parlées en Europe, en Iran et dans le nord de l’Inde (ainsi que leurs exports coloniaux à travers le monde), est une langue qui s’est éteinte avant l’apparition de l’écriture et n’a donc laissé aucune trace écrite de sa grammaire, de son vocabulaire ou quoi que ce soit. Et pourtant les linguistes sont assez confiants pour retracer des formes et du vocabulaire en PIE comme on l’a déjà vu dès que l’on a évoqué de l’étymologie : *hoinos « un », *mḗh1n̥s « lune », *ḱm̥tóm « cent »… Comment cette langue disparue a-t-elle pu resurgir du passé et être reconstruite ? Et comment a-t-on décidé de regrouper les langues qui constituent la famille indo-européenne ?

D’abord, un regroupement génétique est assez simple à établir lorsqu’on a des traces écrites de la langue mère, de ses évolutions et des langues filles qui lui ont succédé au fil du temps : même si son histoire n’est pas parfaitement connue, notamment sur l’évolution de tous ses dialectes, le latin et les langues romanes qui en ont découlées sont attestées par écrit depuis plus de 2000 ans, et ainsi la famille romane est un ensemble plutôt aisé à établir.

Le problème va commencer à se poser lorsque la langue mère n’était pas ou peu écrite, ou que l’évolution est moins documentée, comme pour les langues germaniques. On va alors grâce à un corpus de textes comparer les différentes versions que l’on possède des langues entre elles : on peut effectuer une étude et une comparaison synchroniques (c’est-à-dire comparer plusieurs langues différentes à une même époque) ou alors diachroniques (c’est-à-dire comparer une seule et même langue à différentes époques de son évolution). Lors d’une étude diachronique, on va par exemple examiner l’évolution des phonèmes de la langue et comment la prononciation des sons (et par extension des mots) va varier, puis comparer ces différents changements dans plusieurs langues de manière synchronique et voir si les changements se produisent de manière régulière et concordante d’une langue à l’autre. On appelle cette branche d’étude la linguistique comparée.

Prenons un exemple : dans la famille des langues germaniques, un phénomène appelé la mutation consonantique du haut-allemand (ou seconde mutation consonantique) a impacté les dialectes germaniques du haut-allemand (dialectes du sud de l’Allemagne et de l’Autriche) mais n’a pas eu lieu dans ceux du bas-allemand (dialectes du nord de l’Allemagne ainsi que la langue néerlandaise), de l’anglais ou du reste des langues germaniques : le phonème *p du proto-germanique a donné en haut-allemand pf- à l’initiale, -ff- entre deux voyelles et -f à la finale, alors qu’il s’est maintenu en -p- dans toutes les positions dans les autres langues. Ainsi on aura : Pfütze « puits » en haut-allemand, mais Pütt en bas-allemand, put en néerlandais, pit en anglais ; helfen « aider » en haut-allemand, mais helpen en néerlandais, help en anglais, hilpan en gothique ; offen « ouvert » en haut-allemand, mais open en anglais, åben en danois, opinn en islandais… La mutation touche également les consonnes *t, *k, *b, *d, *g, *f, *þ et *x du proto-germanique, et se manifeste à la fois sur les mots natifs comme sur les emprunts. On peut donc en conclure qu’un dialecte présentant exactement ces mutations dans son vocabulaire a de fortes chances d’appartenir au haut-allemand. On remarque également ici la proximité de vocabulaire entre les différentes langues germaniques (quelques exemples ne suffisent bien évidemment pas à établir un lien de parenté, mais plus l’inventaire de mots apparentés s’agrandit, plus les chances d’avoir devant soi des langues parentes sont certaines).

Ainsi, en comparant le vocabulaire, le sens qu’il a dans les différentes langues, les proximités phonétiques, les évolutions régulières des sons, on peut regrouper avec une certaine certitude une famille génétique de langues. En comparant également cela avec les traits les plus anciens, les tendances linguistiques déjà observées dans d’autres langues (les mutations de phonèmes plus fréquentes dans un sens que dans un autre), on peut reconstruire avec la même certitude le vocabulaire de la langue mère, même si celui-ci n’est pas attesté. L’exercice ne sera jamais à 100% fiable, mais plus le corpus et l’inventaire de termes et d’évolution et grand, plus l’on peut être sûr de la reconstruction effectuée.

Ainsi, on va représenter les familles de langues par des arbres généalogiques, comme dans les familles humaines, ou plus exactement comme les arbres phylogénétiques en biologie (j’aime de ce fait appeler mes arbres de classification de langues des arbres philolinguistiques). Cette approche nait au milieu du XIXe siècle avec l’allemand August Schleicher, introduisant le modèle d’arbre généalogique et s’inspirant de la méthodologie de Charles Darwin dans sa théorie de l’évolution des espèces.

Arbre génétique des langues mayas depuis le proto-maya d’après « Tree of maya languages », par Régis Lachaume, licence CC-0

Une autre approche de regroupement des langues se fait non pas par la génétique qui les relie mais par leur proximité géographique et surtout les échanges linguistiques que cela a amenés. Des populations partageant des aires géographiques voisines pendant un certain temps vont finir par s’influencer les unes les autres, et lorsque des caractéristiques linguistiques distinctes commencent à émerger dans le groupe de langues (que ce soit du vocabulaire pour les échanges légers ou bien jusqu’à la structure même de la langue et son fonctionnement pour les échanges plus poussés), on a à faire à une aire linguistique, ou une Sprachbund (du fait que beaucoup des premiers linguistes étaient allemands ou germanophones, certains termes linguistiques techniques sont en allemand). Ainsi, les langues du Caucase forment la Sprachbund des langues caucasiennes, et même si la linguistique comparée a pu regrouper ces langues en trois familles génétiques (langues kartvéliennes, langues abkhazo-adygiennes et langues nakho-daghestaniennes), rien n’indique aujourd’hui qu’elles ont toutes un ancêtre commun.

Notons également que certains regroupements linguistiques se font de manière géographique sans cependant reposer sur le concept de Sprachbund : par exemple, les langues papoues en Asie du sud-est et en Océanie ne constituent pas une famille génétique unique (on en a répertorié à l’heure actuelle plus d’une quarantaine, ainsi que plus de 30 isolats), et possèdent des structures diverses ; l’appellation langues papoues repose alors plus sur un facteur géographique que linguistique, et ce genre de « familles » de langues est souvent le signe que trop peu de choses sont actuellement connues sur les langues qui les composent.

On peut alors se demander où est la limite entre linguistique comparée et filiation génétique des langues d’un côté et Sprachbund et influence géographique de l’autre côté. Et comme bien souvent dans ces cas-là, elle reste floue : il va falloir redoubler d’efforts pour classifier et comparer les langues, et faire appel aux études historiques et autres témoignages que l’on possède pour déterminer la manière dont l’évolution des langues s’est produite. Ainsi, si l’on a émis en 1844 l’hypothèse selon laquelle les langues turques, mongoles, toungouses, finno-ougriennes et samoyèdes pourraient, à l’instar des langues indo-européennes, faire partie d’une unique famille linguistique appelée langues altaïques (famille qui sera complétée en 1857 avec le japonais et en 1920 avec le coréen), cette famille génétique est aujourd’hui controversée et l’hypothèse alternative classe les langues finno-ougriennes et les langues samoyèdes dans la famille des langues ouraliennes, le coréen comme isolat, le japonais dans les langues japoniques et les langues turques, les langues mongoles et les langues toungouses dans leurs propres familles séparées, expliquant les proximités relevées qui ont amené à la classification du XIXe siècle comme étant les restes d’une ancienne Sprachbund. Cependant, le débat reste encore ouvert dans la communauté linguistique, et les langues altaïques ne sont pas la seule famille de langues controversée qui existe.

La méthode génétique de comparaison et de reconstruction demande donc un travail colossal mais avec du temps et les bonnes sources, elle permet des résultats incroyables. Il ne nous reste alors plus qu’un seul mystère à résoudre : jusqu’où peut-on remonter dans le temps et reconstruire des protolangues ? Pourrait-on même remonter jusqu’à la première langue parlée par l’humanité ? Ça, nous le verrons la semaine prochaine…

#babel #linguistique #sprachbund #comparative #pie #altaic

INTRODUCTION A L’INDO-EUROPEEN

Il a déjà été de nombreuses fois question d’étymologie et de comparaisons entre différentes langues sur ce blog, notamment l’étymologie latine d’un grand nombre de mots français, et le vocabulaire apparenté en espagnol ou en italien. Nous avons également tracé l’évolution du français depuis ses origines, et ce n’est donc pas un mystère ou une information nouvelle : les langues évoluent et changent au fil du temps ; tout comme les espèces biologiques, elles apparaissent, se développent, et finissent par mourir, en laissant potentiellement derrière elles une ou plusieurs descendances.

On peut alors regrouper le français, l’occitan, l’espagnol, le catalan, le portugais, l’italien et le roumain dans la famille des langues romanes, descendantes du latin ; ou bien l’anglais, l’allemand, le néerlandais, le danois, le norvégien, le suédois, l’islandais et le féroïen dans la famille des langues germaniques. On peut ainsi s’amuser à faire d’autres regroupements entre différentes langues d’Europe en se basant sur leurs ressemblances et les traces historiques d’une origine commune.

La question de regrouper des langues de par leurs similitudes et leur passé commun attesté ou suggéré ne date pas d’hier ; en effet si Aristote et Socrate ont dès le Ve siècle avant notre ère émis l’hypothèse d’une évolution linguistique avec modification par insertion, suppression, transposition et substitution de mots, sens et morphèmes, et si Giraud de Barri affirme au XIIe siècle que le gallois, le cornique et le breton descendent d’une langue commune, le premier travail de grande ampleur a lieu au XVIe siècle lorsque français Joseph Scaliger compare et remarque beaucoup de similitudes sur le mot Dieu dans différentes langues romanes, germaniques, slaves, ainsi qu’en grec.

Au XVIIe siècle, Marcus van Boxhorn est pourtant le premier à soupçonner une langue d’origine commune (qu’il appelle le scythique) au grec, au latin, au perse, ainsi qu’aux langues germaniques, slaves, celtes et baltes. En 1786, William Jones donne une conférence sur le sanskrit (la langue liturgique de l’Inde) et émet l’hypothèse d’une origine commune aux langues d’Europe et du sous-continent indien, remarquant la proximité du latin, du grec ancien et du sanskrit.

« La langue sanskrite, quelle que soit son ancienneté, est d’une structure merveilleuse ; plus parfaite que le grec, plus riche que le latin, et plus exquisément raffinée que ce soit, mais en gardant de chacune d’elles une affinité plus forte, à la fois dans les racines verbales et les formes grammaticales, et qu’un accident aurait créé ; aussi fort en effet, qu’aucun philologue ne pourrait examiner toutes les trois, sans croire qu'elles sont issues à partir d’une source commune, qui, peut-être, n’existe plus. » William Jones, 1786

L’hypothèse indo-européenne se développe ensuite dans le courant des XIXe et XXe siècles, bien que le nom donné à la langue origine et à la famille de langues concernées varie au fil des siècles. De langues scythiques ou japhétiques (de Japeth, personnage biblique frère de Sem et Cham, et fils de Noé ; pour les personnes défendant à l’époque le terme japhétique, la descendance de Sem serait à l’origine des langues sémitiques), le XIXe siècle va voir émerger les termes « langues indo-germaniques », dû aux premières langues étudiées et considérées dans l’hypothèse ainsi qu’à un fort nationalisme naissant en Europe, et « langues aryennes ». Ce terme servira sur la deuxième moitié du XIXe et sur la première moitié du XXe siècle à l’idéologie nationaliste allemande puis nazie sur la race aryenne.

Le terme aryen dérive du sanskrit आर्य arya « noble » et est utilisé dans certains textes sanskrits par les auteurs pour parler d’eux-mêmes et de leur peuple. Le terme de « langues aryennes » a donc été dans un premier temps utilisé de par l’hypothèse selon laquelle les ancêtres communs des indo-européens se nommaient également ainsi. Pourtant, il semble être plus une évolution spécifique à la branche dont vient le sanskrit, et à cause de sa connotation raciste aujourd’hui, il n’est plus utilisé en linguistique que pour désigner un groupe spécifique de langues indo-iraniennes, localisées dans le nord de l’Inde : les langues indo-aryennes. D’ailleurs, l’expression antique avestique (langue liturgique de la religion zoroastrienne) Aryānam xshathra « royaume des Nobles », a dérivé en Ērān shahr, puis Iran.

Aujourd’hui donc le terme « indo-européen » a remplacé ses prédécesseurs et est plus que largement accepté et utilisé dans la communauté scientifique. Il désigne à la fois la langue d’origine commune (l’indo-européen commun, ou également dans la littérature anglaise le proto-indo-européen ou PIE) et le ou les peuples qui ont parlé des langues indo-européennes au cours de l’histoire (les Indo-Européens, avec majuscules).

Les langues indo-européennes sont regroupées en dix familles :

les langues albanaises, dont le seul représentant actuel est l’albanais avec 5,4 millions de locuteurs ;

les langues anatoliennes, originaires de l’actuelle Turquie au IIe millénaire avant notre ère et éteintes au cours du Ier millénaire avant notre ère, desquelles faisait partie le hittite ;

les langues arméniennes, dont le seul représentant actuel est l’arménien avec entre 7 et 8 millions de locuteurs ;

les langues balto-slaves, originaires de la vallée de la Volga, bien que certains linguistes séparent encore les langues baltes (le lituanien et le letton) des langues slaves (comme le russe, le polonais ou le serbe) et attribuent les proximités linguistiques des deux groupes plus à des interférences linguistiques dues à une proximité géographique qu’à une origine commune dans la famille indo-européenne ;

les langues celtiques, originaires de la région de Hallstatt au nord des Alpes sur la fin du IIe millénaire avant notre ère et s’étant étendues sur l’Europe continentale et les îles britanniques entre 750 et 250 av. EC, ne sont aujourd’hui plus représentées que par la branche des langues celtiques insulaires avec le gaélique irlandais, le gaélique écossais, le mannois, le gallois, le cornique et le breton, et sont toutes en danger d’extinction ;

les langues germaniques, originaire des rives de la mer Baltique et du nord de l’Allemagne actuelle, et aujourd’hui représentées sur tous les continents, majoritairement par l’anglais ;

les langues helléniques, représentées par le grec moderne et ses 15 à 22 millions de locuteurs, les autres langues de la famille étant aujourd’hui considérées comme éteintes ;

les langues indo-iraniennes, présentes dans l’actuel Turkménistan dès la fin du IIIe millénaire avant notre ère puis s’étendant vers l’Afghanistan et le nord de l’Inde au début du IIe millénaire avant notre ère, et desquelles font partie le sanskrit, l’hindi, l’urdu, le persan et le kurde ;

les langues italiques, originaires du sud des Alpes vers la fin du IIe millénaire avant notre ère, et liées selon certains linguistes aux langues celtiques dans une famille appelée langues italo-celtiques, desquelles le latin deviendra le seul représentant au Ier siècle avant notre ère, supplantant et faisant disparaitre le vénète, le falsique, le picène, l’osque, l’ombrien et le sicule, avant de diverger autour du Ve siècle de notre ère vers les différentes langues romanes que nous connaissons actuellement ;

et les langues tokhariennes, peut-être parlées dès le IIe millénaire avant notre ère mais attestées avec plus de certitude (grâce à des écrits en koutchéen et en agnéen retrouvés) entre 300 et 500 dans le bassin du Tarim en Chine actuelle, avant de disparaître vers l’an 900 lors des invasions Ouïghours.

Évolution du proto-indo-européen vers les différentes familles de langues indo-européennes, d’après « Two-point-equidistant-asia », par Mdf, licence CC-0, et « Kurgan map », par Dbachmann, licence CC-0.

L’hypothèse actuellement la plus acceptée par la communauté scientifique concernant l’origine des Indo-Européens est l’hypothèse kourgane (du russe курган kurgan « tumulus », terme d’origine tatare de même sens), basée sur des preuves linguistiques et archéologiques : le proto-indo-européen aurait été parlé par un peuple originaire des steppes pontiques (au nord de la mer Noire et de la mer d’Azov) entre 5500 et 4000 av. EC, où ils auraient domestiqué le cheval ; ils se seraient ensuite étendus dans toute la région pontique entre 3000 et 2500 av. EC, puis auraient atteint les Balkans et les rives de la mer Caspienne avant 2000 av. EC, l’Asie centrale et le nord de l’Inde entre 2000 et 1500 av. EC, l’Europe centrale et la péninsule italique vers 1000 av. EC, et le nord de l’Europe avant 500 av. EC.

D’autres hypothèses existent, plaçant le point de départ des Indo-Européens et le foyer de locuteurs du PIE en Anatolie entre les VIIe et VIe millénaires avant notre ère (théorie anatolienne de Colin Renfrew, 1987), ou en Inde vers le VIe millénaire avant notre ère (théorie de la Sortie de l’Inde ou de l’Invasion Aryenne) ; certains remontent aussi loin que le Xe millénaire avant notre ère (théorie de la Continuité Paléolithique). Cependant, ces théories sont principalement basées sur des données uniquement archéologiques, sans forcément prendre en compte les langues parlées, et la plupart des linguistes rejettent ces hypothèses. Nous nous concentrerons donc sur l’hypothèse kourgane.

Toujours selon cette hypothèse, entre 3500 et 3000 av. EC a lieu le processus de satemisation et le proto-indo-européen commence à diverger selon deux groupes de dialectes (je tiens à rappeler qu’à l’époque il s’agissait certainement de dialectes, mais aujourd’hui ce sont les ancêtres de plusieurs familles de langues) : ceux dans lesquels la consonne palatale *ḱ (sans doute le son /c/) perd sa palatalisation et devient /k/, et ceux dans lesquels elle dérive vers la fricative /s/. On parle alors de langues centum pour les premières (prononcé /ken.tum/) et de langue satem pour les secondes (prononcé /sa.tɛm/), d’après le mot pour « cent » en PIE : *ḱm̥tóm.

Or, c’est à peu près à l’époque où le proto-indo-européen diverge et disparaît que commence à se développer l’écriture. Cette technologie arrivant à des stades différents de l’évolution des peuples en Europe, certaines langues beaucoup plus récentes n’ont, elles non plus, pas de trace écrite : c’est le cas par exemple du proto-germanique, encore parlé vers l’an 200 mais jamais écrit, alors que le latin par exemple s’écrit dès le VIIe siècle avant notre ère.

Le vocabulaire du PIE ainsi que sa grammaire sont donc reconstruits grâce à un procédé que nous détaillerons la semaine prochaine : la linguistique comparée. Cela étant, retenez que c’est cette ignorance du terme initial exact et sa reconstruction qui amène la notation étoilée des termes indo-européens que nous voyons depuis le premier article. Cette notation n’est d’ailleurs pas spécifique à l’indo-européen commun et s’applique pour toute forme non-attestée et reconstruite d’un mot.

Le proto-indo-européen est une langue complexe et ayant énormément de flexion : on compte 25 consonnes (les nasales *m et *n, les occlusives sourdes *p, *t, *k, *ḱ et *kʷ, les occlusives sonores *b, *d, *g, *ǵ et *gʷ, les occlusives aspirées *bʰ, *dʰ, *gʰ, *ǵʰ et *gʷʰ, la fricative *s, les liquides *r et *l, les semi-voyelles *y et *w, ainsi que trois sons laryngaux notés *h₁, *h₂ et *h₃) et 2 ou 3 voyelles (*e, *o, et selon Manfred Mayrhofer peut-être *a, ainsi que leurs équivalents longs, les diphtongues et les consonnes *h̥₁, *h̥₂, *h̥₃, *m̥, *n̥, *l̥, *r̥, *i, *u à valeur vocalique) ; les noms sont classés selon 3 genres (masculin, féminin et neutre), 3 nombres (singulier, duel et pluriel) et se déclinent selon 8 cas (nominatif, vocatif, accusatif, locatif, génitif, ablatif, datif et instrumental).

« *Hoi(H)nos, *duoh₁, *treies,*kʷetuōr, *penkʷe, *(s)uéks, *séptm, *h₃eḱteh₃, *(h₁)néun, *déḱmt, *duidḱmti, *trih₂dḱomth₂, *kʷeturdḱomth₂, *penkʷedḱomth₂, *ueksdḱomth₂, *septmdḱomth₂, *h₃eḱth₃dḱomth₂, *h₁neundḱomth₂, *ḱm̥tom, *ǵheslo. » Les nombres de 1 à 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 et 1000 en proto-indo-européen, d’après Sihler et Beekes

En près de 7000 ans, l’indo-européen a évolué pour donner près de 600 langues dont on possède une trace aujourd’hui (soit un peu moins de 10% du nombre total de langues répertoriées), et plus de 56% de la population mondiale parle une langue indo-européenne. Lorsque j’ai découvert ce qu’était le proto-indo-européen, ce qu’il représentait pour l’évolution des langues d’Europe et que je me suis renseignée sur ses origines, je suis tombée en admiration devant tant de complexité et de beauté, et devant le travail des linguistes pour faire revenir des Oubliés de l’Histoire cette langue qui est devenue l’une de mes préférées. Je n’ai pu ici qu’effleurer la surface de ce que représentent l’indo-européen et sa culture, et j’espère pouvoir y revenir dans de futurs articles.

#babel #linguistique #indo-européen #pie #proto-indo-european

LES NOMBRES SONT-ILS UNIVERSELS ?

Aujourd’hui, mêlons un peu la linguistique avec mon champ d’expertise : les mathématiques. À l’heure actuelle, les scientifiques ayant envoyé des messages dans l’Espace Profond à destination de potentiels extra-terrestres ont employé comme fondement de leur messages les mathématiques et surtout l’utilisation de nombres : des nombres et des égalités aussi simples et évidentes que « 0 », « 1 », et « 1 + 1 = 2 » se sont alors vu côtoyer des monstres un peu plus poussés, mais estimés basiques, comme pi (la constante du cercle, valant la valeur du périmètre d’un cercle divisée par son diamètre) ou phi (le nombre d’or, considéré comme artistiquement parfait, ayant comme particularité le fait que phi x phi = phi + 1). Les scientifiques responsables de ces messages estiment que si vie intelligente il y a au-delà de notre planète, elle doit avoir évolué pour comprendre les mathématiques comme nous les comprenons.

Cependant, une question me taraude… si je veux bien admettre que l’information relayée par ses nombres peut être universelle, qu’en est-il de la manière de les transmettre ? Les nombres, et les symboles et les noms que nous leur donnons sont-ils une donnée universelle pouvant être comprise par tout le monde ? Pour ce qui est de leur compréhension par des extra-terrestres, la question est un peu épineuse car nous n’avons à l’heure actuelle aucune preuve de leur existence ou d’un contact avec nous. Mais dans ce cas, intéressons-nous à comment nous, humanité de la planète Terre, utilisons les nombres et encodons ces informations.

Un problème va très vite survenir en étudiant ne serait-ce que quelques langues parlées sur Terre : nous n’utilisons pas tous la même base pour compter. Si la majorité des langues fortement parlées utilisent un système décimal (dix unités différentes, de 0 à 9, avant de passer au rang supérieur : 10), le système duodécimal (douze unités différentes) a longtemps été en usage, et on retrouve sa trace notamment dans le système de mesures impérial, où 1 pied est composé de 12 pouces, ou bien dans les noms des nombres de la plupart des langues germaniques : en anglais, si 13, 14 et les nombres suivants sont basés sur le modèle « racine de l’unité » + le suffixe -teen, dérivé de ten « dix » pour signifier « trois après dix » ou thirteen, « quatre après dix » ou fourteen, etc. (en allemand, le suffixe est -zehn, identique à zehn « dix », et on a dreizehn, vierzehn…), les nombres 11 et 12 ont leur propre forme qui ne découle pas de ce système et est unique : eleven, twelve (en allemand : elf, zwölf). On trouve également des restes du système duodécimal dans le décompte des heures du jour et de la nuit (24 = 2 x 12), le nombre de mois de l’année…

Le français possède quant à lui les reste du système vicésimal (vingt unités différentes), que l’on retrouve dans le nom des nombres, tous différents de « un » à « seize », puis « vingt » (dix-sept, dix-huit et dix-neuf respectent eux le modèle décimal et font donc cas d’exception ici), ainsi que dans les formes des dizaines : jusqu’au XIVe siècle, les formes vingt-et-dix pour 30, deux-vingt pour 40, deux-vingt-et-dix pour 50 et trois-vingt pour 60 sont utilisées en même temps que les formes latinisantes trente, quarante, cinquante et soixante. Si ces dernières ont pris une plus grande importance, les dizaines supérieures sont aujourd’hui sujet à dispute dans la francophonie, la France ayant conservé les formes plus anciennes soixante-dix, quatre-vingts et quatre-vingt-dix pour 70, 80 et 90, là où la Belgique et le Luxembourg utilisent septante, quatre-vingts et nonante, et la Suisse septante, huitante et nonante. À noter également que l’Hôpital des Quinze-Vingts à Paris fait usage du vicésimal dans son nom, l’établissement fondé en 1260 pouvant abriter 300 patients. Le système vicésimal est également présent dans les langues celtiques (ce qui laisserait penser que son utilisation en français découle d’un héritage des langues gauloises), dans les langues mayas et aztèques, ainsi qu’en danois, où sa logique est complexe : par exemple, 97 se dit syvoghalvfems « 7 et 90 », mais la partie halvfems du nombre est une abréviation courante pour halvfemsindstyve « la moitié retranchée de cinq, fois vingt » ; ainsi syvoghalvfems veut littéralement dire « sept et la moitié retranchée de cinq fois vingt », soit 7 + (5 - ½) x 20 = 7 + 4,5 x 20 = 7 + 90.

D’autres systèmes ayant d’autres bases existent, notamment en Polynésie et en Nouvelle-Guinée, où les bases 6, 15 et 27 (entre autres) sont utilisées. Mais, au-delà des bases, en comparant deux langues utilisant le même système de numération, peut-être sommes-nous d’accord sur comment noter ses nombres ? Non, loin de là malheureusement… l’anglais, le français, le japonais et l’hindi reposent sur un système décimal, et pourtant l’anglais et le français écrivent leurs nombres en regroupant les chiffres par groupes de trois (1 000 000 000) et possède des termes spécifiques pour les puissances de mille (mille = 1 000, un million = 1 000 000), là où le japonais repose sur un regroupement par quatre (10 0000 0000) et possède des termes spécifiques pour les puissances de dix-mille (dix-mille = 万 man ou 1 0000, cent millions = 億 oku ou 1 0000 0000), et où l’hindi va faire des regroupement par deux, excepté le premier regroupement qui se fait par trois (1 00 00 00 000), et possède सहस्त्र sahastr ou हजार hazaar pour mille (1 000), लाख lakh pour cent mille (1 00 0000) et करोड़ crore pour dix millions (1 00 00 000). D’ailleurs, si l’anglais et le français utilisent les mêmes groupes, les séparateurs sont différents (points ou espaces en français pour les milliers, virgule pour les décimaux : 1.000,00 ; virgule en anglais pour les milliers, point pour les décimaux : 1,000.00), ainsi que les noms donnés aux nombres : le français utilise l’échelle longue de comptage dans laquelle 1 000 000 représente un million, 1 000 000 000 un milliard et 1 000 000 000 000 représente un billion ; l’anglais utilise l’échelle courte, dans laquelle ces mêmes nombres s’appellent respectivement un million, un billion, un trillion. À noter que pour éviter la confusion, certaines personnes refusent même d’utiliser les termes au-delà de milliard, et utilisent un dérivé de l’échelle longue, dans laquelle ces nombres s’appellent un million, un milliard et mille milliards.

Alors, sommes-nous au moins d’accord sur la manière de compter les premiers nombres avec nos doigts ? Vous devez vous douter de la réponse, mais encore une fois non. Si en Europe continentale, la méthode la plus répandue consiste à représenter 1 par le pouce levé, puis d’ajouter l’index pour faire 2, le majeur pour 3, l’annulaire pour 4 et l’auriculaire pour 5, et de répéter sur l’autre main pour 6, 7, 8, 9 et 10, les anglais (encore eux) représentent 1 par l’index levé, et ajoutent le majeur pour 2, l’annulaire pour 3, l’auriculaire pour 4 et le pouce pour 5, et répètent sur l’autre main pour les nombre de 6 à 10. Certains comptages partent de l’auriculaire pour remonter jusqu’au pouce, ou alternent du pouce à l’auriculaire sur une main et de l’auriculaire au pouce sur l’autre main (pour ainsi toujours déplier le doigt directement à gauche (si l’on commence à compter de la droite) ou directement à droite (si l’on commence à compter de la gauche) du précédent), ou lèvent de base le nombre de doigts que l’on veut atteindre et les referment un à un pour décompter (ainsi, une main ouverte peut représenter 1, puis ne présenter que quatre doigts signifiera 2, etc. jusqu’à ce qu’il ne reste qu’un doigt levé pour représenter 5). D’autres comptages reposent sur les phalanges de la main (notamment pour compter de 1 à 12 sur une seule main) ou sur des parties du corps servant de repère : par exemple, pour énumérer de 1 à 10, on peut pointer dans l’ordre l’auriculaire, l’annulaire, le majeur, l’index, le pouce, le poignet, l’avant-bras, le pli du coude le bras et l’épaule.

En somme, la diversité dans le domaine des nombres est telle sur Terre qu’il peut paraître dérisoire et hautain de penser que le système que nous utilisons et avec lequel nous tentons de communiquer avec une vie intelligente au-delà des limites de notre atmosphère est le seul modèle « universel »…

#babel #linguistique #nombres #bases de comptage

Trending Blogs

Recently Viewed Blogs

Bric à Brac en Linguistique