Exploiter les entités nommées est maintenant devenu un élément incontournable d'un grand nombre de processus impliquant le traitement automatique du langage naturel ou la fouille de textes[5]. Cela nécessite généralement d'utiliser des bases lexicales volumineuses, aussi exhaustives que possible, des entités à référencer, de concert avec des méthodes contextuelles permettant de déterminer quelle entité est mentionnée dans un texte donné.
Les entités nommées sont sujettes, entre autres, à trois phénomènes compliquant leur reconnaissance et leur liaison : la synonymie (il peut y avoir de nombreuses expressions pour une entité donnée), l'homonymie (une expression linguistique donnée peut être associée à des entités distinctes selon le contexte) et la métonymie (une expression linguistique, dans un contexte donnée, peut être associée à une entité différente de celle qu'elle désigne habituellement).
Par ailleurs, les entités nommées sont réputées être une classe ouverte : il est impossible d'en faire une liste complète, et de nouvelles entités (ou dénomination d'entités) sont continuellement créées. Leur traitement est ainsi d'autant plus difficile que l'on cherche à reconnaître des entités rares ou nouvelles (donc absentes de la base lexicale). Ceci explique que les exemples pédagogiques ne puissent pas rendre compte de la difficulté de la tâche lorsque l'on sort du domaine général.
Les dernières évolutions en matière de traitement des entités nommées se tournent vers la liaison de ces dernières à un référentiel (par exemple DBpedia ou Wikidata) : il s'agit non seulement de déterminer quelle est la catégorie d'une expression linguistique, mais également quel individu d'une base de connaissances est mentionné (ce qui résout le cas particulier des homonymes)[6].