Théorème de Kleene

En informatique théorique, et plus précisément en théorie des automates, le théorème de Kleene affirme qu'un langage est rationnel (c'est-à-dire décrit par une expression rationnelle) si et seulement s’il est reconnu par un automate fini. C'est un théorème fondamental de la théorie des langages formels et des automates. La première formulation de ce théorème est due au mathématicien Stephen C. Kleene^[1]^,^[2].

Le début des automates finis, et notamment la genèse du théorème de Kleene est décrite par Dominique Perrin^[2]. La première mention des automates finis remonte à un article McCulloch et Pitts en 1943^[3]. C'est Stephen Kleene qui reprend cet article en 1956, et présente la première preuve de son théorème^[1]. Le premier exposé complet est donné par Rabin et Scott en 1959^[4].

Formulation contemporaine

Depuis le traité d'Eilenberg^[5], le théorème de Kleene est formulé de façon plus concise comme suit.

L'ensemble des langages rationnels sur un alphabet $A$ est par définition le plus petit ensemble de parties de $A^{*}$ contenant les singletons et l'ensemble vide, et fermé par les opérations d'union, concaténation et étoile. Cet ensemble est noté ${\text{Rat }}A^{*}$ .

On appelle langage reconnaissable sur un alphabet $A$ tout langage qui peut être reconnu par un automate fini sur $A$ . L'ensemble des langages reconnaissables est noté ${\text{Rec }}A^{*}$ .

Le théorème de Kleene s'énonce alors comme suit.

Théorème de Kleene — Sur un alphabet fini $A$ , il y a égalité entre langages rationnels et langages reconnaissables. En d'autres termes, on a

{\text{Rat }}A^{*}={\text{Rec }}A^{*}

Démonstrations

De nombreuses variantes de démonstrations de ce théorème existent^[6]. La plupart des preuves sont constructives, c'est-à-dire que l'on donne des algorithmes qui calculent un automate à partir d'une expression rationnelle, et une expression rationnelle à partir d'un automate.

Inclusion Rat A* ⊂ Rec A*

On prouve que l'ensemble des langages reconnaissables est fermé par les opérations d'union, produit et étoile en réalisant les constructions des automates appropriés (voir le paragraphe Construction d'automates finis à partir des expressions rationnelles de l'article Automate fini non déterministe) ; comme il contient de plus les singletons et l'ensemble vide, on conclut en utilisant la définition de ${\text{Rat }}A^{*}$ .
On prouve que les langages décrits par une expression rationnelle sont reconnus par automate fini. Les méthodes les plus répandues sont :
- la méthode de Thompson ;
- la méthode de Glushkov ;
- la méthode de Brzozowski.

Les applications pratiques ont suscité un intérêt pour le développement d'algorithmes efficaces pour réaliser les constructions qui interviennent dans la preuve.

Inclusion Rec A* ⊂ Rat A*

Il s'agit de donner une expression rationnelle pour le langage reconnu par un automate fini. Trois algorithmes sont courants :

L'algorithme de McNaughton et Yamada : on calcule par itération les langages reconnus dont les chemins n'utilisent que certains états ;
L'algorithme de Conway, dû à John Horton Conway : on calcule la matrice des langages reconnus par partition ;
L'algorithme d'élimination ou méthode de Brzozowski et McCluskey : on élimine les états, et on remplace les étiquettes par des expressions rationnelles.
Le lemme d'Arden.

Toutes ces méthodes sont des méthodes d'élimination d'états.

Généralisations et extensions

Théorème de Kleene-Schützenberger

On doit au mathématicien Marcel-Paul Schützenberger l'extension du théorème de Kleene aux séries formelles (respectivement aux automates pondérés). Le théorème affirme qu'une série formelle en variables non commutatives à coefficients dans un demi-anneau est rationnelle si et seulement si elle est reconnue par un automate fini pondéré, dont les poids respectifs des étiquettes sont des éléments de ce demi-anneau^[7].

Extensions aux monoïdes

Voir aussi : ensemble rationnel.

Le théorème de Kleene a fait l'objet de tentatives d'extension aux monoïdes généraux, pas nécessairement libres. Étant donné un monoïde $M$ , les parties rationnelles de $M$ sont la plus petite famille de parties de $M$ contenant les singletons et l'ensemble vide, et fermée par union, produit et passage au sous-monoïde engendré (l'analogue de l'étoile de Kleene dans les monoïdes). On note ${\text{Rat }}M$ l'ensemble des parties rationnelles de $M$ .

Il convient d'exprimer de façon plus algébrique la notion de partie reconnaissable d'un monoïde. Une partie $H$ d'un monoïde $M$ est une partie reconnaissable de $M$ si elle est saturée par une congruence d'index fini, en d'autres termes s'il existe un monoïde fini $N$ , et un morphisme surjectif $f:M\to N$ tel que $H=f^{-1}(K)$ , où $K=f(H)$ . On note ${\text{Rec }}M$ l'ensemble des parties reconnaissables de $M$ .

Avec ces définitions, l'égalité ${\text{Rec }}M={\text{Rat }}M$ est par exemple vraie dans les monoïdes finis. McKnight a prouvé que si $M$ est un monoïde finiment engendré, alors ${\text{Rec }}M\subset {\text{Rat }}M$ . L'égalité n'est pas vraie en général. En particulier, dans le produit de deux monoïdes libres, les parties rationnelles sont les transductions rationnelles, alors que les parties reconnaissables sont, d'après un théorème de Mezei, des unions finies de produits de parties reconnaissables des deux monoïdes composants^[6].

Le cas des groupes

Un sous-groupe $H$ d'un groupe $G$ est une partie reconnaissable de $G$ si et seulement s'il est d'index fini.

Un sous-groupe $H$ d'un groupe $G$ est une partie rationnelle de $G$ si et seulement s'il est finiment engendré.

Si $G$ lui-même est finiment engendré, le théorème de McKnight cité plus haut implique que tout sous-groupe d'index fini est finiment engendré, un résultat habituellement attribué à Howson.

Théorèmes de Kleene pour les monoïdes partiellement commutatifs

Le théorème de Kleene reste valide, sous réserve d'une restriction de l'étoile de Kleene, dans les monoïdes des traces ou monoïdes partiellement commutatifs libres^[8].

Soit $A$ un alphabet. Une relation d'indépendance ou relation de commutation $I$ est une partie $I$ de $A\times A$ qui est irréflexive et symétrique. Une relation d'indépendance $I$ définit une relation de dépendance réflexive et symétrique $D$ par $D=A\times A\setminus I$ , et réciproquement.

Une relation d'indépendance induit une relation binaire $\sim$ sur $A^{*}$ , où $u\sim v$ si et seulement si $u=xaby$ et $v=xbay$ pour des mots $x,y\in A^{*}$ et une paire $(a,b)\in I$ . On note $\equiv$ est la fermeture réflexive, symétrique et transitive de $\sim$ . Le monoïde des traces est le monoïde quotient de $A^{*}/{\equiv }$ . Les éléments de $A^{*}/{\equiv }$ sont des traces. Pour un mot ou une trace $w$ , on note ${\text{alph}}(w)$ l'ensemble des lettres qui apparaissent dans $w$ . Deux traces $u$ et $v$ sont indépendantes si toute lettre de $u$ commute avec toute lettre de $v$ . Une trace $u$ est connexe si ${\text{alph}}(u)$ induit un sous-graphe dont les sommets sont les lettres et les arêtes sont les éléments de $D$ .

L'étoile de Kleene concurrente (concurrent star en anglais) d'une partie $X$ de $A^{*}/{\equiv }$ est l'ensemble $(c(X))^{*}$ , où $c(X)$ est l'ensemble des traces connexes non vides qui commutent avec une trace de $X$ . Notons ${\text{Rat}}^{c}(A^{*}/{\equiv })$ le plus petit ensemble de parties de $A^{*}/{\equiv }$ contenant les singletons et l'ensemble vide, et fermé par les opérations d'union, produit et l'étoile de Kleene concurrente. On a alors l'égalité suivante, due à Ochmański :

{\text{Rat}}^{c}(A^{*}/{\equiv })\ =\ {\text{Rec}}(A^{*}/{\equiv }).

Notes

1 2 Kleene (1956)
1 2 Perrin (1995)
↑ McCullogh et Pitts (1943)
↑ Rabin et Scott (1959)
↑ Eilenberg (1984)
1 2 voir Sakarovitch (2003)
↑ Pour des extensions et variantes, voir Droste et al. (2009)
↑ Ce paragraphe est tiré de Diekert et Métivier (1997).

Articles

Warren S. McCulloch et Walter Pitts, « A logical calculus of the ideas immanent in nervous activity », Bull. Math. Biophys., vol. 5,‎ 1943, p. 115-133
Robert McNaughton et H. Yamada, « Regular Expressions and State Graphs for Automata », IEEE Transactions on Electronic Computers, vol. 9, n^o 1,‎ 1960, p. 39-47

Stephen C. Kleene, « Representation of events in nerve nets and finite automata. Automata studies », Annals of Mathematics Studies, Princeton University Press, n^o 34,‎ 1956, p. 3-41
Dominique Perrin, « Les débuts de la théorie des automates », Technique et science informatiques, vol. 14, n^o 4,‎ 1995, p. 409-433 (lire en ligne)
Michael O. Rabin et Dana Scott, « Finite automata and their decision problems », IBM J. Res. Develop., vol. 3,‎ 1959, p. 114-125
Michaël Cadilhac, Dmitry Chistikov et Georg Zetzsche, « Rational Subsets of Baumslag-Solitar Groups », dans Artur Czumaj Anuj Dawar Emanuela Merelli (éditeurs), Actes de ICALP 2020, Schloss Dagstuhl - Leibniz-Zentrum für Informatik, coll. « LIPIcs » (n^o 168), 2020 (DOI 10.4230/LIPIcs.ICALP.2020.116, arXiv 2006.11898 (version détaillée), lire en ligne), p. 116:1-116:16

Bibliographie

Olivier Carton, Langages formels, calculabilité et complexité, 2008 [détail de l’édition] (lire en ligne)

(en) Volker Diekert et Yves Métivier, « Partial Commutation and Traces », dans G. Rozenberg, A. Salomaa (éditeurs), Handbook of Formal Languages, vol. 3 : Beyond Words, Springer Verlag, 1997 (ISBN 978-3-5406-0649-9)

(en) Manfred Droste, Werner Kuich et Heiko Vogler, Handbook of Weighted Automata, Springer-Verlag, 2009, 608 p. (ISBN 978-3-642-01491-8)

(en) Samuel Eilenberg, Automata, Languages and Machines, Vol. A, New York, Academic Press, 1974 (ISBN 978-0-12-234001-7)

(en) John E. Hopcroft, Rajeev Motwani et Jeffrey D. Ullman, Introduction to Automata Theory, Languages, and Computation, Addison-Wesley, 2007, 3^e éd. (ISBN 978-0-32146225-1)

Jacques Sakarovitch, Éléments de théorie des automates, Vuibert, 2003, 816 p. (ISBN 978-2-7117-4807-5)
Traduction anglaise avec corrections : Elements of Automata Theory, Cambridge University Press 2009, (ISBN 978-0-52184425-3)

v · m Informatique théorique
Codage	Codage de l'information Compression de données Chiffrement Cryptanalyse Cryptographie Théorie de l'information
Modèles de calcul	Calculabilité Décidabilité et indécidabilité Ensemble récursif Problème de l'arrêt Ensemble récursivement énumérable Machine de Turing Thèse de Church Automate cellulaire Réseau de neurones artificiels Réduction polynomiale Problème NP-complet Principe de Church-Turing-Deutsch
Algorithmique	Algorithmique Algorithme glouton Algorithme probabiliste Algorithme génétique Complexité algorithmique Analyse d'algorithme Diviser pour régner Heuristique Programmation dynamique Géométrie algorithmique Algorithmes de tri Algorithmique du texte Exploration de données Science des données Apprentissage profond Test de primalité Structure de données Arbre enraciné Concurrence Parallélisme
Syntaxe	Réécriture Compilation Expression régulière Grammaire formelle Langage rationnel Ensemble rationnel Théorie des langages Théorie des automates Automate fini Automate sur les mots infinis Automate d'arbres Automate à pile Hiérarchie de Chomsky Linguistique informatique
Sémantique	Interprétation abstraite Méthodes formelles Vérification de modèles Sémantique des langages de programmation Sémantique dénotationnelle Sémantique axiomatique Sémantique opérationnelle
Logique mathématique	Assistant de preuve Calcul des prédicats Correspondance de Curry-Howard Fonction récursive Lambda-calcul Théorèmes d'incomplétude de Gödel Théorie des types
Mathématiques discrètes	Combinatoire Algorithme du simplexe Optimisation combinatoire Théorie des graphes Algorithmes de la théorie des graphes Recherche opérationnelle Théorie de la décision Analyse numérique