Index Thomisticus
From Wikipedia, the free encyclopedia
L' Index Thomisticus fut un projet d'Humanités numériques lancé dans les années 1940, qui a permis de créer une concordance de 179 textes consacrés à Thomas d'Aquin. Dirigé par Roberto Busa, ce projet a indexé 10 631 980 mots en 34 ans, initialement sur des cartes perforées. Il est considéré comme un projet pionnier dans le domaine des humanités numériques.

Projet
Busa a lancé le projet en 1946[1]. En 1949, IBM a accepté de le financer jusqu'à son achèvement. [2] Paul Tasman, un cadre de l'entreprise, a été chargé de collaborer avec Busa[3]. Busa a sélectionné 179 textes centrés sur Thomas d'Aquin, destinés à pouvoir être lu d'une machine. Parmi ces œuvres, 118 étaient de la main de Thomas d'Aquin, et les 61 autres lui avaient été attribuées par erreur ou constituaient une tentative de compléter une des œuvres inachevées du philosophe. [2]
Une part importante du projet consistait en la saisie des données, réalisée avec minutie par une équipe d'opératrices. Leur dévouement et leur précision ont été essentiels à la réussite du projet[4]. Ce travail de perforation a été effectué entre 1950 et 1966 à Gallarate, en Italie[5],[6], et le projet a atteint son apogée en 1962 avec 70 opératrices. [7] Une fois la perforation terminée, les données ont été lemmatisées par un processus semi-automatique[5].