Bigramme

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.

Cet article ne cite pas suffisamment ses sources (août 2024).

Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ».

En pratique : Quelles sources sont attendues ? Comment ajouter mes sources ?

Cet article est une ébauche concernant le jeu.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Un bigramme est un cas particulier de n‑gramme : c'est une séquence de deux éléments adjacents, généralement deux mots consécutifs dans un texte.

En linguistique computationnelle, les modèles de n‑grammes (dont les bigrammes), sont largement utilisés pour analyser les fréquences de séquences et mettre en évidence des motifs récurrents, comme des préférences lexicales, des formules figées ou des tics de langage ; ces méthodes peuvent contribuer à identifier des formes de répétition cyclique que l’on peut décrire, dans une perspective plus interprétative, comme des « boucles textuelles » (Une boucle textuelle est un motif de texte (mot, groupe de mots, syntagme, fragment de phrase, titre, slogan) qui se répète de manière cyclique dans un discours ou un corpus, souvent avec une forme identique ou très proche. Cette répétition peut être intra‑texte (au sein d’un même texte : refrain, anaphore, leitmotiv, reprise d’un même segment) ; ou inter‑texte (à travers différents textes : recyclage de titres, de slogans, de formules fixées, etc.).

Dans le domaine de l'intelligence artificielle

Un modèle de langage bigramme est un modèle statistique qui prédit chaque mot d’une séquence uniquement à partir du mot qui le précède, en appliquant l’hypothèse de Markov pour simplifier les dépendances linguistiques.

Il calcule ainsi des probabilités conditionnelles sur des paires de mots consécutifs, ce qui en fait un outil simple mais limité, capturant seulement des dépendances locales. Malgré ces limites, il a été une base historique importante pour des applications comme la génération de texte, la reconnaissance vocale ou la traduction automatique, et il a servi de base à des modèles plus avancés tels que les trigrammes et les réseaux neuronaux modernes^[1].

Dans le domaine de l'intelligence artificielle

Dans le domaine des jeux

Exemples

Applications

Références

Related Articles