Universal Networking Language
From Wikipedia, the free encyclopedia
Le langage UNL est un langage formel informatique permettant de coder une représentation du sens d'un énoncé. On se sert de cette représentation comme d'un pivot interlingue dans des systèmes de traduction automatique ou d'un langage de représentation d'information dans des applications de recherche d'information.
Fondé à l'IAS (Institute of Advanced Studies) de l'Université des Nations unies à Tokyo en , le projet UNL rassemble maintenant[Quand ?] des partenaires du monde entier, avec plus de 14 langues couvertes.
Le but du projet UNL est de favoriser l'éclosion d'un véritable multilinguisme dans une société de l'information en pleine expansion. Le souhait des concepteurs est que cela permettra à toutes personnes de communiquer et d'accéder à l'ensemble des informations sur internet dans sa langue maternelle[réf. nécessaire].
Multilinguisme ou Multi-bilinguisme
Le point fort du projet UNL est la promotion du multilinguisme. Une grande confusion règne actuellement sur internet, concernant cet aspect. On entend ainsi dire qu'avec les moteurs de traduction automatique de première ou de seconde génération, internet deviendra multilingue. Cette croyance est fondamentalement fausse !
La première raison provient de la dominance économique de l'anglais. Ainsi, par exemple, en 2007, la société SYSTRAN proposait 12 traducteurs dont deux seulement où ne figure pas l'anglais (français → allemand et allemand → français). Pour qu'un portugais accède à un document français, il lui faut demander une traduction français → anglais, puis une traduction anglais → portugais. Les erreurs de la seconde traduction se combinant avec celles de la première, le résultat n'a plus grand chose à voir avec le document demandé.
La seconde raison est purement économique. Si l'on souhaite fournir des outils de communication permettant à une communauté de six langues de travailler en commun, il faut développer 15 paires de langues (soit 30 traducteurs), 21 pour 7 langues, 28 pour 8 langues, ...
Ainsi, puisqu'il est difficile de développer de nombreuses paires de langues, on développe en priorité des traducteurs de et vers l'anglais.
Aussi, investir dans des techniques se basant sur des outils bilingues a pour effet de renforcer encore la position dominante de l'anglais sur internet. Notre utilisateur portugais, qui souhaitait lire un texte rédigé par un Français, va donc demander la traduction français→anglais dudit texte et il tentera de décoder le résultat anglais.
Une telle politique ne peut donc que creuser le fossé entre les internautes qui comprennent l'anglais et ceux qui ne parlent que leurs langues maternelles. Ainsi, pour beaucoup, le « portail sur le monde » est et restera fermé à clé.
La démarche d'UNL est parfaitement multilingue. En se basant sur une représentation abstraite dont on se sert comme d'un pivot interlingue, toutes les langues sont considérées sur un pied d'égalité. Ainsi, il suffit de développer un outil qui fait le lien (dans les deux sens) entre une langue et cette représentation pivot adoptée par l'ensemble des partenaires.
Certes, le développement de ces outils est plus complexe que le développement d'une paire de langues pour un traducteur de deuxième génération, mais le bénéfice est évident : pour satisfaire une communauté de 6 langues, il faut développer 6 outils, 7 pour 7 langues, 8 pour 8 langues...
Spécifications du Langage UNL
Le langage UNL est un langage informatique permettant de coder une représentation du sens d'un énoncé. On se sert de cette représentation comme d'un pivot interlingue. Les auteurs de la spécification insistent sur le fait que le langage UNL n'est pas une langue. Il ne peut être utilisé directement par un non spécialiste.
Depuis le , les spécifications du langage UNL[1] sont ouvertes à tous sur le serveur de l'UNDL (Universal Networking Digital Language Foundation).
Les expressions UNL ne doivent pas seulement être définies rigoureusement, mais être aussi générales que possible pour être comprises par toutes les personnes chargées du développement des enconvertisseurs et des déconvertisseurs.
Le vocabulaire UNL est formé de :
- UW (Universal Word ou en français Unité de Vocabulaire Virtuel) qui représentent des acceptions ou ensembles d'acceptions interlingues. Par convention, on a utilisé des mots anglais pour établir le vocabulaire UNL, car cette langue est compréhensible par la majorité des acteurs du projet ;
- étiquettes de relations sémantiques ;
- étiquettes d'attributs qui expriment, à un niveau interlingue, l'actualisation (détermination, nombre, genre), l'aspect, la modalité, l'emphase, etc.
Un attribut particulier, @entry, indique l'élément central de l'énoncé représenté, pour la partie (scope) considérée. Les UW dérivées du mot anglais « book » sont décrites comme suit :
book : garde tout sens possible
book(icl>publications) : sens limité par une UW hyperordonnée
= livre en tant que publication
book(=accounts) : sens limité par une autre UW
= livre de comptes
book(obj>room) : restriction par une relation distinctive
= réserver (une chambre)
À titre d'exemple, la phrase Les singes mangent des bananes peut être représentée en UNL comme suit :

Dans l'exemple ci-dessus, « monkey(icl>animal) », eat(icl>action) et banana(icl>food) sont des UWs ; « agt » (= agent d'une action) et « obj » (=objet d'une action) sont deux relations sémantiques directes reliant chacune deux UWs et "@present", "@generic" et "@entry" sont des attributs modifiant les UWs.
