Vocabulaire du lojban
From Wikipedia, the free encyclopedia
Le vocabulaire du lojban est conçu pour qu'une analyse morphologique formelle soit toujours possible : même sans en connaître le sens, il est toujours possible de séquencer un énoncé en mot (en s'appuyant notamment sur les accents et les arrêts vocaliques), et il est toujours possible de déterminer la classe grammaticale d'un mot inconnu[1]. Il y a trois classes principales de mots, et quatre unités d'analyse morphologique, qui se distinguent par leur morphologie :
- Les cmene, les noms propres. Un nom propre doit toujours se terminer par une consonne (ou plus), et donc être suivi d'une pause marquant la fin du mot (notée par un point).
- Les cmavo qui sont des petits mots grammaticaux jouant des rôles divers. Un cmavo se caractérise morphologiquement par le fait qu'il se termine par une voyelle, et ne contient jamais de double consonne.
- Les brivla, noms de relation, correspondant aux noms communs et aux verbes, les deux classes étant assimilées en lojban. Un brivla se caractérise par le fait qu'il se termine par une voyelle et contient toujours une paire de consonnes dans les cinq premières lettres (sans compter y et apostrophes). Ils ont toujours au moins deux syllabes, et portent l'accent sur l'avant-dernière syllabe[2].
- De plus, pour la formation des mots composés lujvo, des « formes recombinantes » (rafsi) sont attribuées à certains des brivla (racines) et de certains cmavo[3],[4].
Suivant leur origine, il existe trois catégories de brivla, qui peuvent se distinguer par leur morphologie :
- les gismu, les mots racines qui permettent de construire les autres brivla ;
- les lujvo (mots composés), composition de brivla ;
- les fu’ivla (mot étranger importé), des mots issus de langues naturelles, lojbanisés.
Cependant, ces trois types de brivla jouent exactement le même rôle dans la grammaire du lojban.
Les mots grammaticaux sont des cmavo, prédicat lojban signifiant « être un mot structurel (de classe x2) ».
Le cmavo en lojban peut normalement être de l'une des quatre forme V, CV, VV ou CVV[5]. Les cmavo comportant deux voyelles se prononcent en deux syllabes et sont normalement accentués sur la première ; ceux d'une syllabe peuvent ou non être accentués au choix du locuteur (et le plus souvent ne le sont pas).
Les cmavo sont regroupés par séries grammaticales, les selma'o. Ce sont des groupes de termes grammaticaux, qui remplissent une même fonction, donc interchangeables pour ce qui est de l'analyse grammaticale. La grammaire lojban identifie 122 selma'o différents[6], comprenant au total près d'un millier de mots grammaticaux[7], ce qui reflète la richesse et la finesse de la grammaire lojban. L'usage lojban, notamment dans les dictionnaires et les grammaires, est de désigner un selma'o par l'un de ses membres (généralement le premier alphabétiquement) mis en majuscule (le h minuscule remplaçant alors l'apostrophe).
- NB : Ce terme lojban selma'o est évidemment régulier, et s'analyse comme se,l,ma'o, où ma'o est la réduction de cmavo, et se (lui-même un cmavo) inverse la relation des deux premiers termes de son prédicat (un 'l' intercalaire sans sémantique, fonctionnant comme un trait d'union, est ajouté pour que les cinq premières lettres du mot comprennent une consonne double). Là où « X cmavo » signifie que X est un cmavo, et « X cmavo Y » signifie plus précisément que X est un cmavo de classe grammaticale Y, la relation inversée « Y selma'o X » signifie que Y est la classe grammaticale à laquelle appartient X - et donc le prédicat réduit « Y selma'o » signifie que Y est une classe de termes grammaticaux.
Certains cmavo possèdent des rafsi, qui peuvent aider à convertir un tanru (séquence de brivla) en un lujvo:
- ve detri → veldetri
- se ke cpacu djica → selkemcpadji
Racines - gismu
Les 1350 gismu (mot racine exprimant une relation) constituent le vocabulaire de base, ce qui est un nombre relativement faible par rapport à la langue française[8]. Théoriquement, en apprenant que ces mots racines, ainsi que leurs formes et certains grands cmavo (mots-structures), il est possible de communiquer efficacement en lojban. Leur forme est toujours CVCCV ou CCVCV, où C est une consonne et V une voyelle, sachant qu’il y a des paires de consonnes interdites.
Ils ont été choisis ou ajoutés comme mots racines parce qu'ils :
- représentent des concepts basiques,
- représentent des concepts dont l'utilisation est tout aussi fréquente dans des langages différents,
- sont utiles dans la construction de mots plus complexes, ou
- représentent des concepts grammaticaux fondamentaux du Lojban[3].
Selon Robin Turner[9], la création a été réalisée par ordinateur, algorithmiquement.
Presque tous les gismu du lojban ont été construits en partant de morceaux de mots tirés d’autres langues, plus spécifiquement le chinois, l’hindi, l’anglais, l’espagnol, le russe et l’arabe (les six langues naturelles les plus parlées). Pour un concept donné, le ou les mots correspondants dans ces six langues ont été transposés dans la phonétique lojban. Le choix a été en principe fait de manière à maximiser la facilité qu’auront les locuteurs des six langues à le reconnaître, en introduisant des pondérations reflétant le nombre de locuteurs de chacune de ces six langues.
Le gismu a ensuite été transformé pour être mis sous forme canonique CVCCV ou CCVCV, sachant qu'en principe deux gismu ne se distinguent jamais par la voyelle finale (c'est-à-dire que les quatre premières lettres suffisent à identifier le gismu) : Un gismu (mot racine) se caractérise par le fait qu'il a exactement cinq lettres, il commence par une consonne et se termine par une voyelle, contient toujours une paire de consonne, et est formé de deux syllabes (dont la première est donc accentuée). Si la double consonne est à l'initiale, elle doit faire partie des 48 paires admissibles comme initiales[10].
Le résultat est parfois encore reconnaissable, par exemple pour rokci rappelant l'anglais rock, ou cmalu l'allemand shmall ; mais c'est au mieux un aide-mémoire pour qui connaît l'origine du terme, et il n'est généralement pas possible de deviner la signification d'un gismu inconnu.
Mots composés - lujvo
Le mécanisme de base pour étendre le vocabulaire ou spécifier la sémantique est de superposer deux brivla (mots prédicatifs), le premier modifiant la sémantique du second. Cette construction prend le nom de « métaphore » ou tanru (racine qui désigne la relation entre la nouvelle métaphore et ses mots composés). Par exemple, à partir des deux racines patfu (être père de) et mamta (être mère de), la superposition mamta patfu désignera un père maternel, donc (probablement) la relation correspondant au grand-père maternel (père de la mère). La construction par simple métaphore est nécessairement ambigüe ; dans tous les cas la construction désigne un père, mais suivant le contexte, mamta patfu peut aussi bien désigner un père qui (par certains aspects) peut en même temps être qualifié de mère, par exemple un « père-poule »[11].
Lorsque le concept établi par métaphore est suffisamment important ou fréquent, il devient souhaitable de lui assigner un mot particulier (brivla) et un sens précis. Un lujvo (racine signifiant « mot composé », inspirée irrégulièrement de pluja>luj : complexe, et valsi>vo : mot) est ainsi formé conventionnellement par la concaténation de racines, que l'on retrouve sous forme pleine (gismu) ou abrégée (rafsi), ou éventuellement de termes grammaticaux (cmavo). La formation du lujvo nécessite également de lui attribuer un sens précis (contrairement à la métaphore qui peut être ambigüe), et de préciser le sens de ses compléments positionnels (qui contrairement au cas du tandu peuvent être différents de ceux du terme final)[12].
Le mot composé (lijvo) assigné à une métaphore (tanru) est construit par la concaténation de blocs élémentaires qui représentent les racines (gismu). Ces blocs d'assemblage sont appelés rafsi (forme recombinante) en lojban. Toute racine dispose de deux à cinq formes recombinantes :
- En cinq lettres (et deux syllabes), la forme pleine de la racine elle-même ;
- En quatre lettres (et une syllabe), la racine privée de sa consonne finale ;
- En trois lettres (et une syllabe), une racine peut en outre avoir une forme abrégée (au plus) de chacun des types CVC-; CCV- ou CVV-.
Bien que techniquement toutes ces formes soient des formes recombinantes, seules les formes irrégulières en trois lettres sont données par les dictionnaires sous la rubrique rafsi. Dans l'exemple précédent, mamta a mam pour rafsi, et patfu a paf ou pa'u comme rafsi irréguliers.
Le néologisme doit respecter les règles morphologiques des mots prédicatifs (brivla), c'est-à-dire qu'il doit se terminer par une voyelle et contient toujours une paire de consonnes dans les cinq premières lettres (sans compter y et apostrophes). Dans cette concaténation, un y intercalaire (qui ne compte pas pour réterminer l'accent) est inséré dans les groupes de consonnes qui seraient autrement illicites ou induiraient une séparation de mot, et inversement, un r (ou à défaut un n) est inséré lorsqu'une forme rafsi de type CVV se rattacherait au reste du mot composé sans créer de paire de consonne[11].
Ceci étant dit, n'importe quelle choix de forme recombinante est une solution valide pour représenter le mot composé, à condition que les formes des mots prédicatifs soient respectées (doit se terminer par une voyelle et contient toujours une paire de consonnes dans les cinq premières lettres). Ainsi, le concept précédent de grand-père maternel peut s'exprimer par :
| mamta | mamt- | mam- | |
| patfu | mamta.patfu | mamt.y.patfu | mam.patfu |
| pa'u | mamta.pa'u | mamt.y.pa'u | mam.pa'u |
Et le concept symétrique de grand-mère paternelle pourra s'exprimer par :
| patfu | patf- | paf- | pa'u | |
| mamta | patfu.mamta | patf.y.mamta. | paf.mamta. | pa'u.r.mamta. |
En pratique, il est évidemment sans intérêt d'utiliser des formes recombinantes qui ne permettent pas de réduire le mot composé ; et seules les formes les plus courtes (ici, ce serait mampa'u et pafmamta) sont données par le dictionnaire, même si les autres formes seraient tout autant valides et sémantiquement équivalentes.