Accueil – Dictionnaire de la création lexicale

L’époque historique a fait connaître le lexique de nombreuses langues. Les termes lexicaux sont donc innombrables, mais certains ont parfois la même origine, sous diverses formes, dans plusieurs langues. Toutefois l’analyse des dictionnaires étymologiques se termine toujours par « origine inconnue », « onomatopée », « terme de substrat », « étymologie populaire », « étymologie obscure », « emprunt »…Une racine reconstruite peut être proposée pour assurer son adaptation au système phonétique de chaque langue, et la cohérence sémantique des différentes versions attestées, mais on ignore toujours pour quelles raisons les phonèmes qui la composent lui ont donné son sens.

Le postulat saussurien de l’ « arbitraire du signe » souligne la difficulté : le « signe linguistique », qui unit « non pas un nom et une chose, mais un concept (« signifié ») et une image acoustique (« signifiant ») », est arbitraire, car le signifiant « est immotivé, c’est-à-dire arbitraire par rapport au signifié, avec lequel il n’a aucune attache naturelle dans la réalité« . Et, selon Saussure, « la question de l’origine du langage n’existe même pas. Ce serait étudier où commence le Rhône, localement et temporellement. Question absolument puérile » : il serait donc très difficile de remonter très haut vers cette origine.

La famille des langues indo-européennes (i.-e.) s’identifie par certaines caractéristiques grammaticales et phonétiques, mais aussi un important vocabulaire d’origine commune, comme le nom des nombres. Or, malgré toutes les recherches, les nombres ont toujours été considérés comme « immotivés », c’est-à-dire ne se rattachant à aucune racine intelligible.

La famille chamito-sémitique (ou afro-asiatique) regroupe plusieurs rameaux, dont les langues chamitiques (ainsi l’égyptien hiéroglyphique) et sémitiques (dont l’hébreu et l’arabe). Mais, si le sémitique montre un certain lexique commun (dont les nombres), l’ensemble de la famille ne présente toutefois que quelques dizaines de racines reconnues communes, sans les nombres, toujours « immotivés ».

Or, la résistance des termes lexicaux est frappante, et l’enseignement des mots de la « langue maternelle » commence bien avant celui de la grammaire. Les mots peuvent donc provenir d’un très lointain passé, bien antérieur aux premières sources écrites, qui sont nécessaires pour l’étude de l’agencement des mots (grammaire), et moins pour celle des mots eux-mêmes. Ainsi, le croisement de la linguistique avec d’autres disciplines (mythologie, rituels religieux, calendriers antiques), a conduit à l’hypothèse que, en i.-e., le nom des nombres de 1 à 5, puis de 6 à 10, pourrait symboliser les cinq étapes d’un mythe originel préhistorique, évoquant le cycle de la sève dans la végétation : du manque apparent hivernal (« 1 » et « 6 ») à la cueillette des fruits ardemment désirés, depuis l’époque reculée des chasseurs-cueilleurs (« 5 » et « 10 »).

A partir de 1998, ce mythe a été recherché en égyptien hiéroglyphique (é.-h.), dont l’étude a montré son existence, donc très ancienne, et confirmée par la publication, en 2003, d’une peinture rupestre du Tassili algérien. Ses cinq épisodes, restés alors énigmatiques, représentent une jeune fille, en relation avec des récipients, et dont la tête est toujours surmontée de quatre petits points : le 4ème épisode (accouchement) accrédite la 4ème étape du cycle envisagé (métaphore de la naissance-croissance des fruits). Les principes de construction du lexique é.-h. ont été progressivement mis en évidence, selon trois stades de complexité croissante :

  • le phonème noté « 3 » en é.-h. (consonne double ᵓ, alef sémitique, occlusive glottale ou « coup de glotte »), et figuré par un « vautour » (signe G1 de la liste Gardiner des signes é.-h.), est doté d’un double sens (« ôter, déchirer », et « tenir », caractérisant bien le rapace dépeceur), et peut créer, seul, quelques termes lexicaux (avec suffixes appropriés)
  • ce phonème génère, avec chacune des 23 autres consonnes é.-h., dotées elles-mêmes (sauf les nasales « m » et « n ») d’une signification propre (par « motivation phonémique » originelle), 46 « étymons » morphologiques, opérant sur 18 « secteurssémantiques » (selon le sens de « 3 » et de fréquentes métaphores), soit 828 étymons sémantiques théoriques, capables de produire, par images, la totalité du lexique, pourtant très riche et diversifié
  • en effet, les radicaux (le plus souvent de deux ou trois consonnes, et « 3 » fréquemment implicite) sont construits par assemblage de deux ou trois étymons, quasi-synonymes ou de sens connexe : tout radical exprime donc une sorte de pléonasme dont la morphologie spécifique précise le lexique. Du fait de la motivation phonémique, les étymons signifiants peuvent s’inverser en gardant le même sens, et s’intervertir dans les radicaux. Les consonnes é.-h. (de 5 000 ans, et d’origine inconnue) pourraient dériver de phonèmes signifiants très antérieurs, préservés grâce au système hiéroglyphique millénaire. Ces phonèmes déterminent un système de « codification » adapté aux groupements primitifs errants, car les phonèmes voisés (chargés des harmoniques dûs aux vibrations des cordes vocales) évoquent une allure de déplacement plus lourde et chargée (et donc plus lente) que les non-voisés (plus légers et vifs).

Les autres langues étudiées, après analyse des lois de correspondance phonétique avec les consonnes signifiantes é.-h., révèlent la même méthodedecréation lexicale : la racine triconsonantique sémitique (inexpliquée) est une « norme » de trois étymons (avec exceptions), et, en i.-e.,  le modèle de racine proposé par Benveniste en 1935 (Consonne-Voyelle-Consonne : CVC) assemble deux étymons « C3 » et « 3C » (avec affixes ou élargissements). Dans la « racine chamito-sémito-indo-européenne » ainsi mise en évidence, le phonème « 3 » se transpose quasiment comme la voyelle qu’il porte : voyelle longue ou brève en sémitique, mais toujours brève en i.-e. (exemples plus loin). En tête d’étymon, il génère (ou non) l’esprit rude grec (aspiration aléatoire) ou la hamza arabe.

L’occlusive glottale « 3 » répond aux deux fricatives glottales : voisée « H » et non-voisée « h ». En chamito-sémitique et en i.-e., ces deux phonèmes sont corrélés avec d’autres consonnes de l’alphabet phonétique (labiales, dentales-alvéolaires, palatales, vélaires…), qui évoquent ainsi des allures lentes (consonnes voisées) ou rapides (consonnes non-voisées). Il n’est donc pas indifférent d’utiliser « H » ou « h » (et les consonnes corrélées), car la racine chamito-sémito-indo-européenne garde encore, non seulement la trace de l’assemblage des étymons, mais aussi l’empreinte de la « codification » phonétique originelle. Les « signaux vocaux » obligent à reconsidérer le postulat saussurien de l’arbitraire du signe, qui n’apparaît juste qu’en première approximation : par la motivation phonémique, toute consonne révèle une « image phonémique » qui nuance et colore les signifiants formés par les locuteurs-créateurs.

Sur ces bases, le « Dictionnaire de la création lexicale » (DCL) propose l’origine (morphologique et sémantique) de 109 000 références, toutes créées par les 46 étymons morphologiques (ou 828 sémantiques). Il s’agit de 33 000 formes primitives, ayant généré 76 000 termes lexicaux d’une trentaine de langues, dont 52 000 pour six langues : 25 000 pour le groupe chamito-sémitique (é.-h., arabe, hébreu) et 27 000 pour le groupe indo-européen (sanskrit, grec, latin). De plus, 7 000 pour le germanique, montrant l’évolution diachronique de la racine chamito-sémito-indo-européenne (cf. « Formation du lexique germanique« , 2017).

Les résultats suivants ont été obtenus en i.-e. :

  • la racine peut se réduire à un seul étymon (« C3 » ou « 3C », avec affixes ou élargissements)
  • l’assemblage C3-3C crée une « suite 3-3 », avec cinq conséquences possibles : voyelle longue (fusion de deux voyelles brèves identiques issues des deux phonèmes « 3 »), voyelle brève (abrégement de la fusion, par facilité), diphtongue (deux voyelles brèves différentes jointives), ou, par compensation phonétique, géminée de la consonne « C » du second étymon « 3C », ou infixe nasal (« m », « n ») précédant cette consonne (cf. exemples)
  • cet assemblage C3-3C, qui justifie le Thème I (CVC) du modèle de racine Benveniste, alterne avec C3-C3 : inversion du second étymon, pouvant être complétée par un troisième étymon « 3C » d' »élargissement », expliquant alors la forme CCVC du Thème II du modèle de racine Benveniste (résultant de C3-C3-3C, avec nouvelle « suite 3-3 »)
  • toute voyelle brève initiale révèle « 3 » initial (ou semi-consonne « j » ou « w » d’un étymon « j3 » ou « w3 » préfixé), et « a » long initial un « ‘ayin » de type chamito-sémitique
  • toutes les désinences grammaticales sont créées par assemblage d’étymons signifiants (jouant le rôle de « marqueurs »), ce qui remplace la « théorie des laryngales », imaginée pour rendre compte d’alternances vocaliques de qualité et de quantité entre radical et désinence, imputables, en fait, à des suites 3-3 (« 3 » radical et « 3 » désinentiel) (cf. « Désinences grammaticales – Théorie des laryngales et théorie de la racine« , 2013),

en sémitique :

  • la racine triconsonantique (trilitère) est une « norme » de trois étymons (deux si le phonème « 3 » est l’une des trois consonnes) avec des exceptions de un ou deux étymons
  • l’inversion des étymons est fréquente au sein du radical formant les termes lexicaux
  • la hamza interne au radical arabe révèle le « 3 » initial d’un étymon enchaîné
  • le soukoun arabe sur consonne, ou le schwa silencieux hébreu, marquent l’amuïssement d’un « 3 » radical, tout comme dans le Thème II du modèle de racine i.-e. Benveniste, pour l’étymon de tête « C3 » dont la voyelle issue de « 3 » s’amuït totalement (cf. exemples),

et dans les deux groupes de langues, qui font apparaître ensemble (comme en é.-h.) :

  • la faculté d’inversion des étymons, et d’interversion des radicaux, avec le même sens
  • la préfixation du radical par les étymons intensatifs « j3 » et « w3 » (ou leur infixation à l’intérieur) (l’analyse traditionnelle considère des « prothèses » inexpliquées)
  • le même préfixe causatif (étymon « s3 », cf. « Préfixation en « s- » de la racine chamito-sémito-indo-européenne« , 2015) (l’analyse traditionnelle considère « s- mobile » inexpliqué).

Exemples avec « 3 » signifiant « ôter, déchirer » (cf. l’é.-h. – krty = « cornes » <*k3-3r, suff. « -ty »)

  • Gr. κειρω = « couper » (<*k3-3r, *κε-ιρ-ω, suite 3-3 en diphtongue : Thème I CVC)
  • Gr. κουρα = « action de couper » (<id *κο-υρ-α); avec étymon « 3t » désinentiel marqueur
  • Gr. καρτοs = « coupé » (<*k3-3r-3t, *κα-αρ-(ε)τ-οs, abrégement, schwa > Lat. curtus)
  • Gr. κεραs = « corne » (<*k3-3r-3, *κε-ερ-α-αs) (Lat. cornu , id <*k3-3r-3n, *co-or-(e)n)
  • Lat. cerno = « trancher » (<*k3-3r, *ce-er-no, Thème I CVC, suite 3-3 en « e »  bref = V)
  • Lat. certus = « décidé » (<*k3-3r-3t, *ce-er-(e)t-us, étymon « 3t » désinentiel marqueur)
  • Lat. cretus = « criblé » (<*k3-r3-3t, *c(e)-re-et-us, schwa, suite 3-3 en « e » long : CCVC)
  • Skr. krath = « frapper », « blesser », « tuer » (<id, *k(e)-ra-ath, abrég. > Skr. çrath = « tuer »)
  • Ar. kr3 (kara) = « creuser » (<*k3-3r-3 > Ar. krw (karw) = « creusement » : « 3 » en « w »)
  • Héb. kwrH (korê) = « mineur » (<*ko-or-ê, suite 3-3 en « w », suff. « -H »)(krH = « creuser »)
  • Héb. krjH (kriyâ) = « fouille » (<*k3-r3-3, *k(e)-ri-y-â, schwa, suite 3-3 en « j », « -H »)

(é.-h. – 3kr = « Aker » dieu évoquant les profondeurs de la terre (<*3k-3r: enfoncer) lié à

  • Héb. 3kr (ikâr) = « laboureur » <*3k-3r > Ar. 3kr = « cultiver, labourer »
  • Gr. ακροs = « pointu » <id, *ακ-(ε)ρ-οs, schwa > Gr. οκριs = « pointe », Skr. açri).

Et avec « 3 » signifiant « tenir » (é.-h. homophone – krty = « cordons, lacets » <autre *k3-3r, « -ty »)

  • Gr. καιροs = « corde » (<*k3-3r, *κα-ιρ-οs, suite 3-3 en diphtongue : Thème I CVC)
  • Lat. cirrus = « boucle de cheveux » (<*k3-3r, *ci-ir-us : géminée due à la suite 3-3)
  • Lat. curvus = « courbe » (<*k3-3r-3, *cu-ur-u-us, abrégement)
  • Gr. κυρτοs = « courbé » (<*k3-3r-3t, *κυ-υρ-(ε)τ-οs, abrégement, étymon « 3t », schwa)
  • Lat. cratis = « treillis » (<*k3-r3-3t, *c(e)-ra-at-is, schwa, suite 3-3 en « a » long : CCVC)
  • Skr. çrath = « lier » (<*ç(e)-ra-ath, abrég. > Skr. çranth = id : infixe nasal par suite 3-3)
  • Ar. 3krt (akrat) = « bouclé, emmêlé » (<*3k-3r-3t, inversions, *ak-(a)r-at, soukoun)
  • Héb. kwrk (korêx) = « relieur » (<*k3-3r-3k, *ko-or-êx, suite 3-3 en « w ») (krk = « relier »)
  • Héb. krwk (karoûx) = « relié » (<*k3-3r-3k, *ka-ar-oûx, « 3 » en « w »)
  • Héb. krjkH (krixâ) = « reliure »(<*k3-r3-3k, *k(e)-ri-ix-â, schwa, suite 3-3 en « j », « -H »)
  • Gr. κρικοs = « anneau »  (<id, *κ(ε)-ρι-ικ-οs) (Gr. κιρκοs, Lat. circus = id <*k3-3r-3k)

(é.-h. – krty , – k3rty = « jardinier » (« -ty ») (<*k3-3r <*h3-3r: jardin bouclé, entouré) lié à

  • Lat. hortus = « enclos » puis « jardin » <*h3-3r-3t > Gr. χορτοs = « enceinte, cour »
  • Héb. krm (kêrém) = « vignoble » <*k3-3r-3m > Ar. krm = « vigne, vignoble »).

Le cycle de base 5 du mythe du nom des nombres justifie d’autres enchaînements, tels que :

  • 1 – la succession des mois des calendriers antiques, ainsi dans le premier calendrier romain : 1er mois Mars (aussi dieu de la guerre), représentant le déchirement du rang 1 (sève disparue ou faible), 2ème Aprilis (déesse jeune Aphrodite, Etr. Apru, rang 2 : sève jaillissante), 4ème Junius (déesse-mère Junon, rang 4 : naissance-croissance des fruits, cf. l’accouchement du 4ème épisode de la peinture rupestre du Tassili), 9ème November (rang 4 : Lat. novus = « qui vient de naître »), ou 12ème Februarius (rang 2 : Lat. februus = « qui purifie », cf. Artémis hαγνη = « pure », autre évocation de la sève, comme Perséphone).
  • 2 – les étapes du déroulement des rites des Mystères d’Eleusis. Ainsi le jeûne initial des mystes évoque le rang 1 (sève manquante), leur absorption du breuvage κυκεων le rang 2 (sève abreuvante), l’union sexuelle réelle ou simulée le rang 3 (métaphore de la fécondation des fruits, cf. la copulation du 3ème épisode de la peinture rupestre du Tassili, ou le lien entre la 3ème lettre γαμμα et Gr. γαμεω = « faire l’amour », d’étymologie inconnue), le remplissage des vases πλημοχοαι le rang 4 (Gr. πλημα = « fécondation d’une femelle »), et l’épi de blé moissonné à la fin de l’époptie, le rang 5 (ex-cueillette).
  • 3 – l’ « ordre levantin » (inexpliqué), répétant cinq cycles de base 5 (dernier incomplet), des 22 signes phéniciens de trois caractéristiques : nom (radical compris par ses étymons), forme (hiéroglyphe signifiant, souvent pivoté ou retourné), et position (chacun évoque un rang). Ainsi, le hiéroglyphe signe « sein » (métaphore du rang 4) explique à la fois le 4ème signe signe (pivoté, devenu signe ou signe étrusques, D latin), le 19ème (de rang 4) signe (arrondi, signe ou signe étrusques, Q latin) et le 4ème signe nord-arabique signe (téton au centre). Le 19ème signe palmyrénien signe figure le hiéroglyphe signe « pis » (cf. « Construction de l’alphabet phénicien et de ses dérivés (racine chamito-sémito-indo-européenne) » 2018)
  • 4 – la série des noms des cinq « étoiles mobiles » (planètes connues dans l’Antiquité), dont l’origine est traditionnellement considérée comme le calque sémantique grec de divinités babyloniennes de fonctions similaires, mais dont l’expression, en é.-h., sanskrit, grec et latin, établit un classement de ces cinq astres en fonction de leur vitesse de déplacement apparente : de la plus rapide (Hermès-Mercure, rang 1 : messagers des dieux) à la plus lente (Cronos-Saturne, rang 5 : leur faucille), en passant par Aphrodite-Vénus (rang 2), Arès-Mars (rang 3, connexe au rang 1) et Zeus-Jupiter (rang 4 : géniteurs) (cf. « Origines du nom des cinq planètes dans l’Antiquité : mythe du nom des nombres« , 2022).
  • 5 – les 12 Signes du Zodiaque, créés en Inde pour suivre le parcours apparent de la Lune et du Soleil (écliptique). Associés aux 12 mois lunaires (s’enchaînant selon le cycle de base 5), ils regroupent 28 « astérismes lunaires », étoiles divisant l’écliptique en 4 quarts de 7 astérismes, dont le nom sanskrit (et 48 épithètes) et l’ordre s’expliquent par le mythe du nom des nombres. La précession des équinoxes (dérive zodiacale des équinoxes : cycle d’environ 25 800 ans) permet, par ses conséquences sur l’organisation originelle, de dater le système vers -2067 (l’équinoxe de printemps étant alors dans les Pléiades, cf. « Origine du Zodiaque (mythe du nom des nombres, calendrier indien)« , 2023).
  • 6 – les décans égyptiens (et leur lever héliaque, juste avant le soleil), dont apparemment Sirius et Orion, très brillantes, mais non sur l’écliptique : d’où un « anneau décanal » imaginé sous l’écliptique. Mais l’étude des 94 appellations distingue – et le cycle de base 5 enchaîne – 36 « décans réguliers » (et 31 épithètes) divisant l’écliptique en 4 quarts de 9 décans, et 27 appellations de 12 « décans spéciaux » (auxiliaires). En réalité, Sirius et β Orion éclipsaient des décans de bien moindre éclat, lors de leur lever héliaque simultané. Le système atteste deux calendriers (nom et enchaînement des mois régis par le mythe), que la précession des équinoxes (25 800/36 = 717 ans par décan) permet aussi de dater : le premier de 4 saisons (fin du -IVème millénaire) et le second de 3 saisons (vers -2784) (cf. « Les décans égyptiens (mythe du nom des nombres, calendrier égyptien)« , 2024).

Ces exemples, et les lois indiquées par les 109 000 références du Dictionnaire de la création lexicale, témoignent des fines nuances de la motivation phonémique originelle : méconnues par le postulat saussurien de l’arbitraire du signe, convention ne reconnaissant pas la différence, ces nuances marquent pourtant les 828 étymons signifiants, générant les 109 000 références.

Si les langues tonales asiatiques, à base monosyllabique, avéraient, par la modulation des tons, un autre type de différenciation sémantique des étymons, pouvant indiquer leur extrême ancienneté, alors, il ne serait plus impossible de progresser, peut-être, vers l’origine des langues.