Soit un joueur qui dispose d'un ensemble de choix fini
; une stratégie pure est un choix
.
Proposition[1] — Une matrice
de réels
possède un point d'équilibre (ou point-selle) si et seulement si
En tout point d'équilibre de la matrice, l'entrée correspondante du tableau est égale à ce minimax.
Jeu 1
Soit k le nombre de stratégies pures disponibles pour le joueur 1 et n le nombre de stratégies pures disponibles pour le joueur 2. On numérote de 1 à k les stratégies à la disposition du J1 et de 1 à n celles du J2. Prenons un exemple facile de jeu où n = k = 3.
Voici la matrice de gain :
| J1/J2 |
joue sa stratégie 1 |
joue sa stratégie 2 |
joue sa stratégie 3 |
| joue sa stratégie 1 |
-1 |
1,5 |
0 |
| joue sa stratégie 2 |
2 |
2 |
1 |
| joue sa stratégie 3 |
2 |
-3 |
0 |
Le joueur 1 se dit : « Si je joue 1, je risque de perdre 1 unité, et si je joue 3 d'en perdre 3; mais si je joue 2, je gagne une unité dans le pire des cas. »
Le joueur 2 se dit : « Si je joue 1, je risque de perdre 2 unités, et si je joue 2 d'en perdre 2; mais si je joue 3 mes pertes sont limitées à une unité dans le pire des cas.
Le joueur 1, reconstituant le raisonnement du joueur 2 à choisir sa stratégie 3 pour limiter ses pertes, est conforté dans son choix.
Le joueur 2, reconstituant le raisonnement du joueur 1 à choisir sa stratégie 2, est conforté dans son choix (il perdrait 2 s'il choisissait autrement).
Aucun des joueurs n'est prêt à changer sa stratégie car ce sont les choix les plus rationnels.
Par exemple, si le joueur 1 devient gourmand et change sa stratégie pour gagner 1,5 ou 3 unités, sachant que le joueur 2 joue intelligemment et donc sa stratégie 3, le joueur 1 ne gagnerait plus que 0 unité, au lieu de 1. Il n'a donc aucun intérêt à changer sa stratégie. Ce raisonnement est réciproque pour le joueur 2.
En effet, selon la proposition, nous trouvons bien un équilibre :
tandis que 
Le minimax et le maximin sont égaux; la ligne où le minimax est atteint et la colonne où le maximin est atteint indiquent un point d'équilibre.
Jeu 2
| J1/J2 |
joue sa stratégie 1 |
joue sa stratégie 2 |
joue sa stratégie 3 |
| joue sa stratégie 1 |
0 |
-1,03 |
1,02 |
| joue sa stratégie 2 |
1,05 |
0 |
-1,01 |
| joue sa stratégie 3 |
-1,07 |
1,04 |
0 |
Similairement au jeu 1, le joueur 1 va choisir sa stratégie 2 pour minimiser les pertes, ici 1,01 unité. Le joueur 2 choisira sa stratégie 3 où il perdra au pire 1,02 unité.
Le joueur 1 anticipe la décision du joueur 2 et se rend compte qu'il va bel et bien perdre 1,01 unité et choisira alors sa stratégie 1 pour gagner 1,02 unité. Le joueur 2 va lui aussi anticiper cette décision et choisir sa stratégie 2 pour gagner 1,03 unité, etc. Aucune stratégie pure de la part des deux joueurs ne parviendra à s'imposer.
Toujours par rapport à la proposition, nous pouvons remarquer qu'il n'y a aucun équilibre :
tandis que 
Soit un joueur qui dispose d'un ensemble de choix fini
; une stratégie mixte est l'attribution d'une certaine distribution de probabilité sur l'ensemble des stratégies pures
. Bien entendu, chaque stratégie pure
est une stratégie mixte qui choisit
avec une probabilité de 1.
En 1928, John von Neumann démontre son théorème du minimax. Il assure que, pour un jeu non coopératif opposant deux joueurs, à nombre fini de stratégies pures et à somme nulle, il existe au moins une situation d'interaction stable, à savoir une situation dans laquelle aucun des deux joueurs n'a intérêt à changer sa stratégie mixte si l'autre ne la change pas.
Ce théorème est un cas particulier du théorème fondamental de la théorie des jeux à n joueurs de John Forbes Nash, démontré en 1950.
À la différence du cas des points-selle vu précédemment, il existe toujours un équilibre dans un jeu à somme nulle et à deux joueurs aux stratégies mixtes.
Explications :
Soit la stratégie mixte du joueur 1 un vecteur colonne
et le joueur 2 choisit la colonne j, alors le gain moyen du J1 est
. Similairement, soit la stratégie mixte du J2 représentée par le vecteur colonne
et le J1 choisit la ligne i, alors le gain moyen du J1 est
.
De manière plus générale, si J1 utilise sa stratégie mixte
et J2 utilise sa stratégie mixte
, le gain moyen pour le J1 est de :
Désormais, un couple de stratégies mixtes
est un équilibre de Nash pour
lorsque :
- Pour tout
,
(si J2 change de stratégie tandis que J1 conserve la stratégie
, J2 ne peut qu'y perdre)
- Pour tout
,
(si J1 change de stratégie tandis que J2 conserve la stratégie
, J1 ne peut qu'y perdre).
Exemple :
Soit la matrice de gain
:
Analysons premièrement ce jeu du point de vue du joueur 1. Supposons qu'il joue sa stratégie "une" 3/5 du temps et "deux" 2/5 du temps de manière aléatoire (
vaut ici
). Dans ce cas :
- Si J2 choisit sa stratégie 1, J1 perd 2 3/5 du temps et gagne 3 2/5 du temps. En moyenne, il gagne -2(3/5) + 3(2/5) = 0
- Si J2 choisit sa stratégie 2, J1 gagne 3 3/5 du temps et perd 4 2/5 du temps. En moyenne, il gagne 3(3/5) - 4(2/5) = 1/5
Sur la durée, le J1 est assuré d'être rentable. Mais peut-il améliorer cette stratégie pour qu'il ait un gain positif quoi que J2 choisisse ?
Définissons
comme la quantité de fois que J1 choisit sa stratégie 1. Commençons par trouver p tel que J1 gagne le même montant qu'il choisisse sa stratégie 1 ou sa stratégie 2 :



Donc
=
. En moyenne, J1 gagne −2(7/12) + 3(5/12) = 1/12 quoi que J2 choisisse.
Peut-il faire mieux ? Pas si J2 joue intelligemment. En fait, J2 peut utiliser la même procédure et il se retrouvera avec
=
qui lui garantit une perte moyenne d'au plus 1/12.
On dit alors que la valeur du jeu
vaut
.
Soit 
Nous supposons qu'il n'y a aucun point-selle.
Si
alors
sinon b serait un point-selle. Si
, alors
sinon c serait un point-selle.
Donc,
et
.
En résumé, si
,
.
De manière symétrique, si
, alors
.
Comme vu précédemment, reprenons la formule du gain moyen pour le j1 avec
=
lorsque le j2 utilise sa colonne 1 et 2 :
Lorsqu'on résout
, on trouve :
Vu qu'il n'y a aucun point-selle,
et
sont soit tous deux strictement positifs soit tous deux strictement négatifs, donc
. Le gain moyen de j1 pour utiliser sa stratégie vaut :
Le calcul de la perte moyenne de j2 est similaire et nous obtenons :
Cette similarité prouve que le jeu a une valeur et que les joueurs ont leur stratégie optimale (propriété du théorème minimax pour les jeux à stratégies finies).
Exemple 1 :
Exemple 2 :
Dans ce dernier exemple, q devrait être entre 0 et 1. Il ne l'est pas car il existe un point-selle. Dans la matrice A, "1" est un point-selle donc p vaut 0, q vaut 1 et v vaut 1.
Parfois, de grandes matrices peuvent être réduites en taille jusqu'à, dans le meilleur des cas, une matrice 2x2. Pour y parvenir, il faut supprimer les lignes et les colonnes qui sont mauvaises (inutiles) pour les deux joueurs.
Tout ce qui peut être atteint avec une ligne ou une colonne dominante peut être atteint au moins aussi bien avec la ligne ou la colonne dominée.
Donc, la suppression d'une colonne ou d'une ligne dominante ne change pas la valeur du jeu. Cependant, il existe peut-être une stratégie optimale qui utilisait cette ligne et cette colonne dominante et disparaîtra avec sa suppression, mais il restera toujours au moins une stratégie optimale autre part.
Dans le cas d'une suppression d'une colonne ou d'une ligne strictement dominante, l'ensemble des stratégies optimales reste inchangé.
Exemple :
Nous allons itérer la procédure successivement sur les lignes et colonnes sur la matrice A.
| La dernière colonne est strictement dominée celle du milieu. |
| La ligne une est dominée par la ligne trois. |
| Cette matrice n'a pas de point-selle donc :



= et = 
|
Connaissances supposées : la programmation linéaire.
De manière informelle, nous voulons trouver des variables qui sont des distributions de probabilité sur différents choix
. Ces probabilités doivent suivre deux inégalités linéaires :
et
pour tout
.
Notre but est de maximiser le pire cas (le minimum) de notre gain, sur toutes les colonnes que l'adversaire peut jouer. Plus formellement, on assignera une variable
qui représente le minimum et on donnera comme contrainte que notre gain soit au moins
pour chaque colonne et que notre objectif soit de maximiser
. En résumé nous avons :
Variables :
et
.
Objectifs : Maximiser
.
Contraintes :
pour tout
et 
- pour toutes les colonnes
, nous avons 
Ce problème est un programme linéaire et peut donc être résolu.
Connaissances supposées : l'algorithme du simplexe.
L'algorithme le plus courant est la méthode du simplexe, introduite par George Dantzig à partir de 1947. La plupart des exemples sont résolus en temps polynomial mais ce n'est pas garanti. Certains cas peuvent dépasser cette complexité. Nous poursuivrons avec un exemple :
Déclinons
pour les deux joueurs :
que j1 cherche à maximiser et
que j2 cherche à minimiser.
Nous avons donc :
pour le j1
pour le j2
On remarque que le problème du j2 est le "dual" du problème du j1. Ces deux problèmes peuvent donc être résolus ensemble grâce à la méthode du simplexe dual.
Notez que si
est la matrice de gain, c'est la négation de la transposée de
qui est placée dans le tableau du simplexe :
|  |  |  |  |  | |
 |  |  |  |  |  |  |
 |  | | | |  |  |
 |  |  |  |  |  |  |
 |  |  |  |  |  |  |
|  |  |  |  |  | |
Soit la matrice :

Le tableau devient :
|  |  |  |  | |
 |  |  |  |  |  |
 |  |  |  |  |  |
 |  |  |  | ① |  |
 |  |  |  |  |  |
 |  |  |  |  |  |
|  |  |  |  |  |
| | | | | |
Nous désirerions pivoter
et
. Malheureusement, comme toujours pour les matrices de gain pour les jeux, la valeur du pivot vaut 0. Donc on doit pivoter en deux fois : premièrement pour déplacer
en haut et ensuite pour déplacer
à gauche. On inter-change alors
et
et supprimons la ligne
, puis nous inter-changeons
et
et supprimons la colonne
.
Maintenant, nous utilisons la règle des pivots pour la méthode du simplexe jusqu'à obtenir, par exemple :
|  |  |  | |
 | | | |  |
 | | | |  |
 | | | |  |
 | | | |  |
|  |  |  |  |
| | | | |
Donc,
. L'unique stratégie optimale pour le J1 vaut
. L'unique stratégie optimale pour le J2 vaut
.
Cette méthode a été inventée par Leonid Khatchian dans les années 1980 en Russie. L'algorithme ne permet de résoudre que la "faisabilité" du problème mais peut se poursuivre avec une recherche binaire sur la fonction objectif pour résoudre le problème d'optimisation.
Le principe est de commencer avec une ellipse (appelée ellipsoïde pour les grandes dimensions) qui contient à coup sûr la région de "faisabilité". Ensuite, on essaye le centre de l'ellipse et on observe si des contraintes sont enfreintes. Dans la négative, on a terminé. Si oui, on regarde les contraintes enfreintes. Désormais, nous savons que la solution (si elle existe) se trouve dans au plus la moitié restante de l'ellipse. On trouve alors une nouvelle ellipse plus petite qui contient cette moitié et on répète l'opération.
On estime qu'on diminue à chaque étape le volume de l'ellipse d'au moins un facteur de
par rapport à l'ellipse originale. Donc, pour chaque n-étape, le volume diminue d'un facteur de
.
C'était le premier algorithme qui garantissait la résolution d'un programme linéaire en temps polynomial mais reste assez lent en pratique.
L'algorithme de Karmarka est un algorithme introduit par Narendra Karmarkar en 1984 et décrit une complexité polynomiale beaucoup plus rapide que la méthode de l'ellipsoïde en pratique.
L’idée de base de la méthode est d’utiliser des fonctions barrières pour décrire l’ensemble des solutions qui est convexe par définition du problème. À l’opposé de l’algorithme du simplexe, cette méthode atteint l’optimum du problème en passant par l’intérieur de l’ensemble des solutions réalisables. Il utilise la méthode des points intérieurs.