Apprentissage par renforcement inverse

From Wikipedia, the free encyclopedia

En intelligence artificielle, et plus précisément en apprentissage automatique, l'apprentissage par renforcement inverse cherche à faire apprendre la fonction de récompense sous-jacente à partir de l'observation de comportements d'experts[1]. En d'autres termes, c'est l'inverse de l'apprentissage par renforcement qui, elle, cherche à apprendre de bons comportements à partir de récompenses qui sont fixées.

Voir aussi

Références

Related Articles

Wikiwand AI