Analyse Earley

From Wikipedia, the free encyclopedia

En théorie des langages, l'algorithme d'Earley est un algorithme d'analyse syntaxique pour les grammaires non contextuelles décrit pour la première fois par Jay Earley[1]. À l'instar des algorithmes CYK et GLR, l'algorithme d'Earley calcule toutes les analyses possibles d'une phrase (et pas seulement une de ces analyses). Il repose sur de la programmation dynamique.

On peut construire un analyseur Earley pour toute grammaire non contextuelle. Il s'exécute en temps cubique (O (n3), où n est la longueur de la chaîne d'entrée). Pour une grammaire non ambiguë, l'analyse Earley s'effectue en temps quadratique (O (n2)).

Items Earley et tables Earley

Considérons une grammaire non contextuelle ainsi qu'une chaîne d'entrée de longueur notée . L'analyse par l'algorithme d'Earley a pour but de reconnaître la chaîne, donc de dire si la chaîne fait partie du langage engendré par la grammaire.

L'algorithme d'Earley manipule des items Earley, appelés plus simplement des items. Un item est la donnée :

  • d'une règle de production de la grammaire notée  ;
  • un indice de début dans le mot d'entrée, tel que ;
  • un indice de position dans la partie droite de la règle, que l'on représente par un point.

On représente un item sous la forme , où .

Principe de l'algorithme

On dispose d'une table de taille où on stocke des ensembles d'items d'Earley, où est la longueur de la chaîne d'entrée.

Le calcul démarre avec contenant les items de la forme est l'axiome de la grammaire et est une règle de production. Un item représente la situation où l'on n'a encore rien reconnu, mais où l'on cherche à reconnaître l'axiome à partir du début de la chaîne d'entrée. Puis on exécute l'étape 0, 1, ..., jusqu'à l'étape n.

L'objectif de l'étape est de calculer puis de stocker dans une table , l'ensemble des items tels que est reconnu par .

À l'étape , on calcule à partir des tables en saturant dans l'ordre les trois opérations suivantes :

  • Lecture (Scanner en anglais). L'opération de lecture s'effectue pour . Pour tout item de de la forme on ajoute dans l'item . Autrement dit, on fait avancer les points dans les items de s'il précède la lettre lue .
  • Prédiction (Predictor en anglais). Si un item de la forme est dans est un non-terminal, alors pour toutes les règles , on ajoute l'item à l'ensemble . Autrement dit, s'il faut reconnaître, on teste toutes les règles où est en partie gauche.
  • Complétion (Completor en anglais). Si un item de la forme est dans , alors pour tous items de la table de la forme , on ajoute dans . Autrement dit, si a reconnu , on fait avancer les règles qui attendaient la reconnaissance de .

L'analyse réussit si la table contient un item de la forme , où est une production.

Exemple

Considérons la grammaire suivante des expressions arithmétiques :

est l'axiome de la grammaire.

Analysons la chaîne d'entrée . On obtient alors les tables suivantes.Nous y noterons "P:" une opération de prédiction ; "C:" une opération de complétion et "L:" une opération de lecture.

A l'étape 0, le calcul démarre avec . Puis on sature avec l'opération de prédiction.

P:
P:
P:
P:
P:
P:
P:
P:
P:
P:

A l'étape 1, on obtient par l'opération de lecture. L'opération de prédiction ne produit rien car l'indice de position est à la fin de la partie droite. L'item est utilisé par l'opération de complétion pour obtenir , puis , etc. jusqu'à saturation de l'opération de complétion.

L:
C:
C:
C:
C:
C:
C:
C:

A l'étape 2, on obtient par opération de lecture. Comme est juste après l'indice de position dans la première ligne de , on rajoute toutes les règles en prédiction, avec l'indice 2 qui est l'indice de position courant.

L:
P:
P:
P:
P:
P:
P:
P:

A l'étape 3, on lit , donc on complète de en . Ainsi il existe une règle donc la règle se complète en .

On sature par complétion.

L:
C:
C:
C:
C:
C:
C:
C:

Comme est dans , le mot d'entrée est reconnu.

Complexité

Variante

Notes et références

Related Articles

Wikiwand AI