Apprentissage par renforcement inverse

En intelligence artificielle, et plus précisément en apprentissage automatique, l'apprentissage par renforcement inverse cherche à faire apprendre la fonction de récompense sous-jacente à partir de l'observation de comportements d'experts^[1]. En d'autres termes, c'est l'inverse de l'apprentissage par renforcement qui, elle, cherche à apprendre de bons comportements à partir de récompenses qui sont fixées.

[1]

Apprentissage par renforcement inverse

Voir aussi

Références

Related Articles