Joseph Mariani

Naissance 1^er février 1950 (76 ans)

Nationalité

Institutions CNRS

Joseph Mariani

Données clés
Naissance	1^er février 1950 (76 ans)
Nationalité	France

Données clés
Domaines	Informatique,linguistique
Institutions	CNRS
Diplôme	Institut supérieur de l'aéronautique et de l'espace,Université Pierre et Marie Curie

Joseph Mariani (né Joseph-Jean Mariani, le 1^er février 1950), est un chercheur en informatique français, pionnier dans le domaine de l'intelligence artificielle, du traitement automatique de la parole et des technologies des langues^[1].

Après avoir obtenu un diplôme d'ingénieur en aéronautique de l'Institut supérieur de l'aéronautique et de l'espace (ISAE-Supaéro) en 1973 et un doctorat d'ingénieur^[2] de l'Université Pierre et Marie Curie en 1977, Joseph Mariani rejoint le CNRS dans le laboratoire d'informatique pour la mécanique et les sciences de l'ingénieur (LIMSI), à présent Laboratoire Interdisciplinaire des Sciences du Numérique (LISN)^[3] à l'Université Paris-Saclay, en tant que chargé de recherche au CNRS. Il obtient un doctorat ès sciences en 1982^[4] et prend la responsabilité du groupe Communication Parlée du LIMSI de 1982 à 1985. Il part ensuite aux États-Unis (1985-1986) où il est invité comme World Trade Visiting Scientist au Thomas J. Watson Research Center à Yorktown Heights, New York dans l’équipe dirigée par Frederick Jelinek et incluant Robert Mercer et Peter Brown.

A son retour en France en 1986, il devient responsable du Département Communication Homme-Machine (1987-2000), puis directeur du LIMSI (1989-2000). Il élargit les activités du laboratoire en communication homme-machine pour y inclure des activités en Traitement du Langage Naturel, dirigées par Gérard Sabah, Vision par Ordinateur, Réalité Virtuelle, Ergonomie, Psychologie Cognitive, dirigées par Michel Denis et Sciences Sociales. Il participe par ailleurs aux mouvements de défense de la communauté scientifique contre les coupes budgétaires en 1996^[5].

En 2000, il est nommé directeur du Département des Technologies de l'Information et de la Communication au Ministère de l’enseignement supérieur et de la Recherche alors dirigé par Roger-Gérard Schwartzenberg. Il y gère les Réseaux de Recherche et d’Innovation Technologiques en Télécommunications, Génie logiciel, Audiovisuel et Multimédia et Micro et Nanotechnologies, et représente l’Etat aux conseils d'administration de plusieurs organismes^[6] , dont l'Agence nationale des fréquences (ANFr), l'Institut national de l'information géographique et forestière (IGN), l'Observatoire des sciences et des techniques (OST), le Comité national de Métrologie et l'Institut national de recherche en informatique et en automatique (INRIA). Il participe en 2002 à la mise en place du réseau des grandes centrales de base en microélectronique et nanotechnologies (RTB)^[7]. Il est membre du Conseil Général des Technologies de l’Information (à présent Conseil général de l'économie, de l'industrie, de l'énergie et des technologies (CGEIET)), du Comité Scientifique de l’Institut national de recherche et de sécurité (INRS) et du comité d’évaluation du Language Technologies Institute (LTI) de l'Université Carnegie-Mellon (CMU) à Pittsburgh.

De 2007 à 2013, il dirige l'Institut pour les technologies Multilingues et Multimédias de l'Information (IMMI)^[8], Unité Mixte Internationale du CNRS, créée dans le cadre du programme Quaero en collaboration entre le LIMSI, l’Institut de Technologie de Karlsruhe (KIT) (Prof. Alexander Waibel) et l’École supérieure polytechnique de Rhénanie-Westphalie (RWTH) (Prof. Hermann Ney).

Au sein du CNRS, il a présidé la section «Sciences et Technologies de l'information» (1991-1995) et a été membre du Conseil de Département «Sciences de l'Ingénieur » (1996-2000) et du Conseil scientifique (1997-2001) du CNRS. Joseph Mariani est Directeur de Recherche de Classe Exceptionnelle au CNRS depuis 2002. Il a été nommé Directeur de Recherche émérite en Février 2016.

Activité scientifique

Les activités de recherche de Joseph Mariani concernent principalement l’intelligence artificielle et la communication homme-machine, en particulier le traitement de la parole et les technologies des langues^[9].

Traitement du langage parlé et reconnaissance vocale

Au début de sa carrière, il se spécialise sur le traitement automatique de la parole et la reconnaissance vocale, comme un domaine de recherche recouvrant l’acoustique, le traitement du signal, les sciences de l’information et l’intelligence artificielle^[10]. En collaboration avec Jean-Sylvain Liénard, il développe le premier système français de reconnaissance vocale opérationnel (MOISE)^[11], rendu possible par les progrès de la microélectronique et par l'utilisation d'une approche originale de compression temporelle non linéaire^[2], commercialisé par la société Vecsys en 1980^[12], et le premier système français de dialogue oral incluant reconnaissance et synthèse vocales en 1981. Ces systèmes ont été appliqués à l'aide aux personnes handicapées, à l'enseignement assisté par ordinateur, à la numérotation téléphonique vocale, au contrôle aérien et à la réservation de billets de train. En 1980, il écrit un article pour le journal Le Monde^[13] prévoyant l'intégration actuelle des technologies de la parole dans la société.

Il développe un système complet de dialogue vocal pilote-avion en collaboration avec la société Crouzet, dans le cadre du projet Rafale de Dassault Aviation. Les performances de la reconnaissance vocale apparaissent alors cependant insuffisantes et seule la partie de synthèse vocale est depuis largement utilisée dans les cockpits d’avions et d’hélicoptères. Il reçoit pour cette réalisation le prix Science et Défense^[14] du Ministère de la Défense en 1985^[15].

Il étend ensuite le système de reconnaissance de mots isolés dépendant du locuteur à la reconnaissance de parole continue conversationnelle incluant les variétés phonologiques^[16] et indépendante du locuteur^[4] et à la dictée vocale^[17], incluant l’utilisation d’un modèle de langage entraîné sur des données textuelles. Il développe en 1987 le premier système opérationnel français de reconnaissance du locuteur^[12] avec Jean-Luc Gauvain et l’applique à une serrure vocale. Il prend part à la conception d'un circuit intégré de programmation dynamique full custom (MuPCD)^[18], présenté comme le premier ASIC (Application-specific integrated circuit) produit par la société Bull. En 1990, il publie un article^[19] présentant l’ensemble des techniques de reconnaissance vocale utilisées aujourd’hui dans les systèmes opérationnels.

Dans la dynamique de la renaissance européenne, il est cofondateur et premier président (1988) de l'European Speech Communication Association (ESCA)^[20], devenue International Speech Communication Association (ISCA)^[21] en 2000. Il y lance la première conférence Eurospeech à Paris en 1989, devenue à présent Interspeech^[22], plus importante conférence internationale sur le traitement de la langue parlée^[23].

Ressources linguistiques et évaluation

Joseph Mariani a introduit en France le «paradigme d’évaluation» dès le début des années 1980 dans le cadre des activités du groupe OTAN RSG-10^[24], en conduisant des campagnes d'évaluation ouverte avec des indicateurs de performance sur des données partagées par tous les participants et pouvant être combinées et comparées, un processus également appelé «tâche partagée» ou «challenge», et plus généralement «coopétition»^[25]. Ce paradigme d'évaluation, fondé sur l’hypothèse qu’être capable de définir une mesure d’évaluation adéquate, acceptée et partagée dans la recherche d’une solution permet de résoudre une grande partie d’un problème, a conduit à l'amélioration continue au fil des ans des algorithmes de traitement de la parole et du langage naturel, conduisant à présent à l'existence d’assistants vocaux tels que Apple SIRI, Amazon Alexa ou Google Search^[26] ou de systèmes de traduction automatique utilisables.

Il a travaillé avec les chercheurs du NIST, qui est devenu le centre des activités en évaluation des systèmes de traitement automatique de la parole et des langues aux États-Unis à partir de 1987, et du Linguistic Data Consortium (LDC) créé en 1992 pour produire et distribuer les données nécessaires au développement et à l’évaluation de ces systèmes^[27]. En 1994, avec Robert Martin, alors directeur de l'Institut National de la Langue Française (INaLF), il organise la première campagne d'évaluation des analyseurs morpho-syntaxiques pour la langue française^[28]. La même année, il crée et dirige le Réseau francophone sur l'Ingénierie Linguistique (FRANCIL)^[29] au sein de l'Agence universitaire de la Francophonie (AUF) afin de renforcer les activités dans ce domaine pour le Français, et lance sept campagnes d'évaluation dans le domaine du traitement de la langue française écrite et parlée^[30].Après avoir rejoint le ministère de la Recherche, il lance deux programmes interministériels^[31], Techno-Langue^[32] et Techno-Vision, sur le développement et l'évaluation des technologies de traitement du langage humain et de vision par ordinateur^[33].

Il a été le premier coordonnateur à sa création en 1991 du Coordinating Committee on Speech Databases and Speech i/o Systems Assessment (COCOSDA)^[34] qui a engendré en 1998 un chapitre asiatique avec une conférence annuelle, Oriental-COCOSDA^[35]. Il a co-fondé en 1995 avec Antonio Zampolli l'European Language Resources Association (ELRA), à présent international Language Resources Association^[36], qu'il a présidée de 2002 à 2004 et dont il est président honoraire^[37] depuis 2010, et il a suscité en 1998 la création de l’international Language Resources and Evaluation Conference (LREC) , devenue la plus importante manifestation internationale dans ce domaine spécifique de la linguistique computationnelle^[38].

Promotion de la diversité linguistique

Joseph Mariani a préconisé le développement de technologies linguistiques pour toutes les langues, afin de permettre à la fois la préservation des espaces culturels et la communication universelle entre les peuples, comme il l'écrit dans "NET.LANG: Vers le cyberespace multilingue", ouvrage^[39] coordonné par le Réseau MAAYA^[40] présidé par Adama Samassekou et soutenu par l'UNESCO.

En 1995, il a été nommé membre du Conseil Consultatif sur le Traitement Informatique du Langage^[41]. À titre d'expert à la Délégation Générale à la Langue Française et aux Langues de France (DGLFLF), il a participé à l'organisation des Etats Généraux sur le multilinguisme^[42] en 2008 dans le cadre de la Présidence Française de l’Union Européenne, aux Etats Généraux sur le multilinguisme dans les outre-mer^[43] en 2011 et en 2015 à la promotion du traitement automatique des langues régionales françaises^[44]^,^[45]. Tout en soutenant l’avis qu’il n’y a pas de meilleures données que plus de données^[46], il exprime la nécessité que les corpus d’entraînement des systèmes de traduction automatique proviennent de sources variées^[47].

Il a contribué au développement des Technologies de la Langue en Europe en tant qu’expert auprès des instances européennes pour définir leur stratégie dans ce domaine, dans le cadre d’un grand nombre de projets financés par la Commission Européenne à commencer par le projet Polyglot dès 1984, et à travers sa participation à la direction des Réseaux d’Excellence Elsnet^[48] et FlaReNet^[49]. Dans le cadre du projet META-NET (Multilingual Europe Technology Alliance Network)^[50], il a promu le développement de technologies langagières pour toutes les langues européennes^[51]. En 2012, il a participé à l’élaboration des Livres Blancs^[52] qui donnent un aperçu des ressources et des technologies linguistiques existant pour les langues européennes et a coordonné la rédaction du volume pour le français^[53]. Il a également produit les matrices de langue^[54] sur la base de la LRE Map pour mesurer l’existence de ressources linguistiques pour toutes les langues, avec une attention particulière pour les langues officielles de l'Union européenne. Ces efforts ont abouti à une première résolution du Conseil Européen sur une stratégie européenne en faveur du multilinguisme en 2008^[55], puis au vote d’une résolution du parlement européen « Egalité des langues à l’ère numérique » en 2018 ^[56].

À la suite du constat que seulement 2 % des plus de 7 000 langues parlées dans le monde bénéficiaient de technologies des langues, il a lancé la conférence « Technologies des Langues pour Tous » (LT4All) « Permettre la diversité linguistique et le multilinguisme partout dans le monde », qui s’est tenue au siège de l’UNESCO^[57] à Paris en Décembre 2019^[58], dans le cadre de l’Année Internationale des Langues Autochtones (IYIL 2019), visant à convaincre les chercheurs et les industriels d'élargir cette couverture linguistique. Une seconde édition de cette conférence «Promouvoir l’humanisme à travers les Technologies des Langues» a été organisée à l’UNESCO en février 2025^[59], pour veiller à inclure les communautés linguistiques dans le développement de ces technologies pour leur langue, dans le cadre de la Décennie Internationale des Langues Autochtones (IDIL, 2022-2032).

Ethique des Sciences et Technologies de l'Information et de la Communication (STIC)

Joseph Mariani a été nommé au Comité d'éthique du CNRS (COMETS^[60]) en 2006. Dans ce cadre et sous les présidences de Pierre Léna puis de Jean-Pierre Bourguignon, il a coordonné la rédaction du rapport «Pour une éthique de la recherche en sciences et technologies de l’information et de la communication»^[61] publié en 2009^[62], appelant à la création d'un comité national d'éthique spécialement consacré aux sciences et technologies de l’information et de la communication^[63]. Ce comité a été créé en 2012 (CERNA)^[64] et coordonne sur ce thème l’ensemble des organismes publics français qui mènent des recherches sur les STIC. La CERNA a produit son premier rapport sur l'éthique de la recherche en robotique en 2015. Ces initiatives ont conduit au lancement en 2019 du Comité National Pilote d’Ethique du Numérique (CNPEN)^[65], comme une branche du Comité consultatif national d'éthique pour les sciences de la vie et de la santé (CCNE)^[66].

Analyse des publications scientifiques

À la suite d'une invitation à mener une analyse des publications scientifiques sur le traitement du langage parlé à l'occasion du 25^e anniversaire de l’ISCA en 2013^[67], Joseph Mariani et ses collègues ont commencé à recueillir et à étudier les articles parus dans tout le domaine du traitement automatique des langues, y compris le traitement de la parole et la recherche d'information, dans le cadre du corpus NLP4NLP ^[68]^,^[69] qui comprend l'ACL Anthology^[70], les archives ISCA et LREC, les publications de l'IEEE et de l’ACM, ainsi que d'autres conférences et revues sur le traitement de la parole et du langage naturel pour un total de 34 sources, 65.000 documents et 50.000 auteurs couvrant une période de 50 ans (1965 à 2015)^[71]. Après la phase de collecte, les publications ont été analysées automatiquement sous de nombreux angles: collaboration entre auteurs, citations, évolution des sujets de recherche (apparition, disparition et éventuelle résurgence), innovation, plagiat, etc^[72]^,^[73]. Cela a été suivi par une étude des cinq années suivantes (2016-2020)^[74], qui a permis d’identifier des changements profonds dans les thèmes de recherche ainsi que l’émergence d’une nouvelle génération d’auteurs et de publications autour de l’apprentissage automatique et des réseaux de neurones artificiels.

Ouvrages

Joseph Mariani^[75] est auteur, co-auteur ou éditeur^[76] de plus de 500 publications^[77] qui ont reçu plus de 3000 citations ^[78]. Il a été membre des comités de rédaction des revues internationales "Speech Communication"^[79], "Speech Technology"^[80] et "Language Resources and Evaluation"^[81] et de la collection d’ouvrages "Text, Speech and Language Technology"^[82]. Il a encadré 30 thèses de doctorat de 1985 à 2007^[83]. Une session spéciale^[84] lui a été consacrée lors de la conférence JEP-TALN en 2016 commune aux associations francophones ATALA et AFCP^[85].

R. Cole, J. Mariani, H. Uszkoreit, G.B. Varile, A. Zaenen, A. Zampolli (Eds.), Survey of the State of the Art in Human Language Technology, Cambridge University Press, 1998 (ISBN 9780521592772)
Wolfgang Minker, Alex Waibel, Joseph Mariani, Stochastically-Based Semantic Analysis, Springer Kluwer, août 1999 (ISBN 0-7923-8571-3)
K. Chibout, J. Mariani, N. Masson, F. Néel, Ressources et Evaluation en Ingénierie des Langues, Champs Linguistiques, De Boek Supérieur, 1999 (ISBN 978-2801112588)
Joseph Mariani (Ed.), Analyse, synthèse et codage de la parole, Hermes-Lavoisier, 2002 (ISBN 978-2-7462-0440-9)
Joseph Mariani (Ed.), Reconnaissance de la parole, Hermes-Lavoisier, 2002 (ISBN 978-2-7462-0441-6)
Joseph Mariani (Ed.), Spoken Language Processing, ISTE Wiley, décembre 2008 (ISBN 978-1-848-21031-8)
Mariani, J., Rosset, S., Garnier-Rizet, M., Devillers, L. (Eds.), Natural Interaction with Robots, Knowbots and Smartphones: Putting Spoken Dialog Systems into Practice, Springer, octobre 2013 (ISBN 978-1-4614-8279-6)
Eskenazi, M., Devillers, L., Mariani, J. (Eds.), Advanced Social Interaction with Agents, Springer, août 2018 (ISBN 978-3-319-92107-5)

Activité scientifique

Traitement du langage parlé et reconnaissance vocale

Ressources linguistiques et évaluation

Promotion de la diversité linguistique

Ethique des Sciences et Technologies de l'Information et de la Communication (STIC)

Analyse des publications scientifiques

Ouvrages

Distinctions

Liens externes

Références

Related Articles

Related Articles

http://www.lemonde.fr/archives/article/1980/08/25/l-ordinateur-qui-parle_2798018_1819218.html#XUtJYkHm4Q2BM0Us.99

https://www.sciencedirect.com/science/article/abs/pii/0167639383900262

https://www.lemonde.fr/planete/article/2009/07/03/pour-l-ordinateur-traduction-rime-moins-avec-trahison_1214785_3244.html

https://www.frontiersin.org/articles/10.3389/frma.2018.00036/full

https://www.frontiersin.org/articles/10.3389/frma.2018.00037/full

https://www.frontiersin.org/articles/10.3389/frma.2022.863126/full