Arrêt optimal
From Wikipedia, the free encyclopedia
En mathématiques, la théorie de l'arrêt optimal[1],[2] ou de l'arrêt anticipé[3] concerne le problème du choix d'un moment pour entreprendre une action spécifique, afin de maximiser une récompense attendue ou de minimiser un coût attendu. Des problèmes d'arrêt optimaux peuvent être trouvés dans les domaines des statistiques, de l'économie et des mathématiques financières (liés à la tarification des options américaines). Un exemple clé de problème d'arrêt optimal est le problème du secrétaire. Les problèmes d'arrêt optimal peuvent souvent être écrits sous forme d'une équation de Bellman et souvent résolus à l'aide d'une programmation dynamique.
Les problèmes de règle d'arrêt sont liés à deux entités :
- Une séquence de variables aléatoires , dont la distribution jointe est supposé connu
- Une séquence de fonctions de « récompense » qui dépendent des valeurs observées des variables aléatoires en 1 :
En considérant ces éléments, le problème se pose de la manière suivante :
- Vous observez la séquence de variables aléatoires, et à chaque étape , vous pouvez choisir d'arrêter l'observation ou de continuer
- Si vous arrêtez d'observer à l'étape , vous recevrez une récompense
- Vous souhaitez choisir une règle d'arrêt pour maximiser votre récompense attendue (ou de manière équivalente, minimiser votre perte attendue)
En temps continu
Soit un processus de gain défini sur un espace de probabilité filtré et supposons que est adapté à la filtration. Le problème d'arrêt optimal est de trouver le temps d'arrêt qui maximise le gain attendu
où est appelée la fonction valeur . Ici peut prendre de la valeur .
Nous considérons un processus de Markov adapté défini sur un espace de probabilité filtré où désigne la mesure de probabilité à laquelle le processus stochastique commence à . Étant donné les fonctions continues , et , le problème d'arrêt optimal est
Parfois, on fait référence à la formulation MLS, abréviation représentant les noms de Mayer, Lagrange et Supremum[4].
Méthodes de résolution
Il existe deux approches pour résoudre les problèmes d’arrêt optimal[4]. Lorsque le processus sous-jacent (ou le processus de gain) est décrit par ses distributions inconditionnelles de dimension finie, la technique de solution appropriée est l'approche martingale, ainsi appelée parce qu'elle utilise la théorie de la martingale, le concept le plus important étant l'enveloppe de Snell. Pour des plages de temps discrètes et un horizon de planification fini, la résolution du problème peut être aisément effectuée en utilisant la programmation dynamique.
Lorsque le processus sous-jacent est déterminé par une famille de fonctions de transition (conditionnelles) conduisant à une famille de probabilités de transition de Markov, de puissants outils analytiques fournis par la théorie des processus de Markov peuvent souvent être utilisés et cette approche est appelée méthode de Markov. La solution est généralement obtenue en résolvant les problèmes de frontière libre (problèmes de Stefan).
Un résultat de diffusion par saut
Soit , une diffusion Lévy en donné par le SDE
où est un -dimensionnel mouvement brownien, est un -dimensionnel mesure aléatoire de Poisson compensée, , , et reçoivent des fonctions telles qu'une solution unique existe. Soit , un ensemble ouvert (la région de solvabilité) et
, le moment de la faillite. Le problème d’arrêt optimal est :
Il s’avère que sous certaines conditions de régularité[5], le théorème de vérification suivant est valable :
Si une fonction satisfait
- où se trouve la région de continuation ,
- sur , et
- sur , où est le générateur infinitésimal de
alors pour tout . De plus, si
- sur
Alors pour tout et est un temps d'arrêt optimal.