Professionnels en réunion illustrant l'équilibre de Nash, hésitant entre deux options stratégiques dans un cadre moderne.

Équilibre de Nash : l’expliquer sans jargon, avec exemples

01/04/2026

Équilibre de Nash : l’expliquer sans jargon, avec exemples

01/04/2026

L’essentiel à retenir
  • L’équilibre de Nash désigne un profil stable où aucun joueur ne gagne à dévier seul de sa stratégie.
  • Un équilibre peut être stable sans être optimal ni juste, reflétant souvent des compromis locaux.
  • La méthode des meilleures réponses permet d’identifier les équilibres en analysant les gains dans une matrice.
  • Les stratégies mixtes introduisent de l’imprévisibilité pour stabiliser les situations sans équilibre pur.
  • La rationalité et les croyances influencent fortement la formation et la perception des équilibres en pratique.

Entre ce que dit une offre d’emploi, ce que comprend un candidat et ce que valide un manager, il y a souvent un décalage très concret à rattraper. Prenez deux équipes qui doivent choisir chacune leur date de livraison : elles cochent leur option sur une liste séparément, puis découvrent qu’aucune n’a intérêt à changer seule tant que l’autre reste campée sur sa décision. Ce petit moment de blocage rationnel résume assez bien l’intuition derrière l’équilibre de Nash : regarder si quelqu’un regretterait son choix en bougeant en solo.

Équilibre de Nash : l’idée simple derrière le mot

On va garder la définition utile au quotidien : une stabilité locale des choix individuels face aux choix des autres joueurs. Pas besoin de jargon pour s’en servir, mais il faut être clair sur ce que « stable » veut dire, et sur ce que ça ne promet pas.

Pourquoi personne ne dévie seul, même si le résultat paraît moyen

Imaginez deux managers qui doivent décider en même temps : augmenter leurs budgets d’équipe dès maintenant, ou attendre le trimestre suivant en se disant « on verra après ». Ils préfèrent tous deux investir ensemble, plutôt qu’investir seuls et porter tous les risques politiques internes.

Un équilibre de Nash correspond au point où chaque décision devient la meilleure réponse aux décisions supposées des autres joueurs. Autrement dit : tant que personne ne bouge autour de vous, changer seul ne vous apporte pas mieux, ou vous expose à une perte immédiate. C’est une logique de « si l’autre ne change rien, est-ce que moi je change ? ».

Le terme clé est unilatéral. Une déviation unilatérale, c’est modifier votre stratégie pendant que les autres gardent exactement la leur. Exemple minimal : si rester vous donne +3 alors que changer seul donne +2, vous restez, même si une coordination pourrait mener à +5.

On tombe parfois sur un compromis tiède, et oui, c’est frustrant. Mais techniquement, la propriété décrite par Nash est simple : personne ne déclenche volontairement son propre désavantage juste pour tenter autre chose. La stabilité, ici, vaut plus que l’enthousiasme.

Ce que l’équilibre dit… et ce qu’il ne dit pas (optimalité, morale, coopération)

L’équilibre de Nash ne désigne ni « la meilleure solution » ni « la plus juste ». Il repère seulement un profil stable sous petites perturbations individuelles : vous testez mentalement « si je change seul, est-ce mieux ? ». Le critère est local, pas collectif.

Résultat : un équilibre peut être socialement médiocre. Dans certains jeux, tout le monde gagnerait à basculer vers une autre situation, mais personne n’a envie d’être le premier à prendre le risque. En entreprise, c’est exactement ce qui fait durer un processus bancal : aucune équipe n’a intérêt à porter seule le coût du changement.

Autre nuance : Nash s’applique bien aux jeux dits non coopératifs. Non coopératif ne veut pas dire agressif ; cela signifie surtout « pas d’engagement commun crédible ». Sans contrat, sans garantie, chacun raisonne avec ce qu’il contrôle réellement.

Vous pensez peut-être : « Donc on subit ? » Pas forcément. Mais pour sortir d’un équilibre, il faut souvent ajouter une brique absente du modèle de base : meilleure information, engagement formel, communication, ou répétition du jeu qui crée de la réputation.

Définition
Un équilibre de Nash est un profil de stratégies (une stratégie par joueur) tel qu’aucun joueur n’améliore son gain (paiement) en déviant unilatéralement, étant donné les stratégies des autres.

Les briques indispensables : joueurs, stratégies, gains et information

Avant de chercher un équilibre, il faut cadrer proprement qui joue quoi, et sur quoi chacun se base pour décider. Beaucoup d’erreurs viennent d’une matrice implicite, jamais formulée, où chacun met des hypothèses différentes.

Forme normale (matrice) vs forme extensive (arbre) : quand utiliser quoi

La forme normale, c’est la matrice de gains : lignes pour les stratégies du joueur A, colonnes pour celles du joueur B. Chaque case associe des paiements aux deux joueurs. C’est très pratique quand les choix sont simultanés, ou traités comme tels.

La forme extensive ressemble plutôt à un arbre : A choisit, puis B répond, parfois en observant le choix, parfois non. Dès que l’ordre des actions, les promesses, ou la crédibilité d’une menace comptent, l’arbre devient plus fidèle. En recrutement, par exemple, certaines décisions sont séquentielles : promesse orale, validation budgétaire, puis contrat signé.

Dans la vraie vie, on compresse pourtant souvent en matrice des situations qui sont en réalité séquentielles. On fait comme si tout était simultané, parce que chacun anticipe la réaction future avant même d’agir aujourd’hui. C’est plus compact, mais parfois moins précis.

Pour choisir : matrice si vous voulez analyser vite des meilleures réponses ; arbre si la crédibilité d’un « ensuite je ferai ceci » change réellement le jeu. Quand une menace n’est pas crédible, la matrice peut vous tromper sur la stabilité.

Rationalité et croyances : en pratique, ce qui bloque souvent

Dans les manuels, les joueurs sont rationnels au sens où ils maximisent leur gain attendu selon leurs croyances. C’est utile pour calculer, mais sur le terrain, les croyances font basculer les résultats. Un manager peut surestimer sa capacité à recruter vite, et durcir sa position salariale.

Un candidat peut, au contraire, sous-estimer ses alternatives et accepter trop tôt. Dans ce cas, les « gains » ne sont pas que des euros : ils incluent le stress, le temps perdu, le risque réputationnel, et l’énergie consommée. La matrice théorique devient fragile si elle oublie ces variables.

L’autre blocage fréquent, c’est l’information disponible au moment du choix. Avec information complète, chacun connaît la matrice ; avec information imparfaite ou incomplète, chacun avance avec des signaux partiels. Beaucoup d’échecs d’accord viennent moins d’un désaccord sur le salaire que d’un désaccord sur les probabilités : chance d’une offre concurrente, chance d’une validation budgétaire, chance d’un gel des embauches.

Moralité opérationnelle : notez explicitement ce qui est su et ce qui est supposé. Sinon, vous calculez un équilibre dans une matrice imaginaire, et vous vous étonnez ensuite que la réalité ne « respecte » pas votre conclusion.

Dominante, meilleure réponse, Pareto : trois notions qu’on confond tout le temps

Une stratégie dominante est celle qui donne un meilleur gain quelle que soit la stratégie adverse. C’est rare dans la vraie vie, mais quand ça existe, cela simplifie tout : vous jouez dominant, point. Le raisonnement devient presque mécanique.

La meilleure réponse est plus contextuelle : c’est votre meilleur choix étant donné le choix de l’autre. C’est le cœur du raisonnement de Nash : on cherche les points où les meilleures réponses se croisent. Si vous oubliez ce « étant donné », vous mélangez des comparaisons qui ne sont pas au même endroit de la matrice.

Pareto-optimal signifie encore autre chose : on ne peut améliorer quelqu’un sans détériorer quelqu’un d’autre. Un résultat peut être Pareto-optimal sans être équitable, et surtout un équilibre de Nash peut être non Pareto-optimal. Autrement dit, il peut être stable tout en étant collectivement perfectible.

Pour ancrer ces différences :

NotionQuestion poséeDépend du choix adverse ?Ce que ça garantitPiège fréquent
Stratégie dominante« Que jouer quoi qu’il arrive ? »NonChoix robusteConfondre robuste et optimal
Meilleure réponse« Que jouer face à telle action ? »OuiRéaction optimale localeOublier les égalités
Pareto-optimalité« Peut-on améliorer quelqu’un sans nuire à l’autre ? »N/AEfficience relativeCroire que Pareto = juste

Quand vous calculez le net à payer, vous partez du brut, vous retirez les cotisations salariales, puis vous appliquez le prélèvement à la source sur le net imposable : c’est ce dernier qui explique pourquoi deux bruts identiques peuvent donner des nets différents.

Trouver un équilibre pas à pas dans une matrice : la méthode des meilleures réponses

Ici, on passe au geste simple : repérer les meilleures réponses dans une matrice, puis isoler les cases stables. Tant que vous restez rigoureux sur la lecture lignes et colonnes, la méthode est fiable.

La check-list en 5 étapes pour ne pas se tromper

Étape 1 : écrivez clairement les joueurs et leurs stratégies possibles, avec deux ou trois options au départ. Sans ça, on mélange des actions concrètes (« baisser le prix ») et des intentions (« être agressif »). Gardez des verbes observables.

Étape 2 : remplissez la matrice avec des gains cohérents pour chaque couple d’actions. Les paiements peuvent être en euros ou en points, peu importe, tant qu’ils reflètent vos préférences. Ce qui bloque souvent ici, ce sont les coûts cachés : temps juridique, risque de réputation, fatigue d’équipe.

Étape 3 : pour chaque colonne (choix fixé du joueur B), trouvez la meilleure réponse du joueur A parmi les lignes. Puis faites l’inverse : pour chaque ligne (choix fixé du joueur A), trouvez la meilleure réponse du joueur B parmi les colonnes. C’est la partie « surlignage mental » : on marque les maxima au bon endroit.

Étape 4 : croisez ces meilleures réponses. Une case où A et B jouent chacun une meilleure réponse est une candidate à l’équilibre en stratégie pure. S’il y en a plusieurs, vous avez plusieurs équilibres.

Étape 5 : vérifiez l’idée centrale : depuis cette case, aucune déviation unilatérale ne doit être profitable. Si c’est vrai pour tous les joueurs, vous tenez un équilibre de Nash en pur.

Astuce
Mini contrôle qualité avant d’annoncer « équilibre trouvé » : comparez A uniquement entre lignes dans une même colonne, et B uniquement entre colonnes dans une même ligne. Et si deux cases sont ex æquo comme meilleures réponses, gardez-les toutes, sinon vous ratez souvent des équilibres multiples.

Exemple 2×2 corrigé : repérer l’équilibre en stratégies pures

Prenons un exemple simple de coordination interne. Deux équipes choisissent entre livrer Vite ou livrer Propre (sans pression extrême). Chacune préfère réussir ensemble plutôt que « bien faire » seule pendant que l’autre fonce.

Voici une matrice stylisée :

Équipe B \ Équipe AVitePropre
ViteA:2 / B:2A:0 / B:3
PropreA:3 / B:0A:4 / B:4

Si B joue Vite, A compare ses gains dans la ligne « Vite » : A obtient 2 s’il joue Vite, contre 0 s’il joue Propre. Sa meilleure réponse est donc Vite. Symétriquement, si A joue Vite, B préfère Vite aussi, car 2 est supérieur à 0.

Si B joue Propre, A compare ses gains dans la ligne « Propre » : 3 s’il joue Vite, contre 4 s’il joue Propre. Sa meilleure réponse devient Propre. Et si A joue Propre, B préfère Propre également, car 4 est supérieur à 3.

On obtient donc deux équilibres en stratégies pures : (Vite, Vite) et (Propre, Propre). Le second est meilleur pour tout le monde, mais le premier reste stable si chacun craint de se retrouver seul à investir dans la qualité.

Équilibres multiples : comment les repérer et pourquoi ça change l’interprétation

Dès qu’il y a plusieurs équilibres en stratégies pures, le concept perd une partie de son pouvoir prédictif. La théorie vous dit « voici des points stables », mais elle ne vous dit pas automatiquement lequel sera joué. Pour trancher, il faut souvent une règle de sélection qui vient du terrain.

Dans l’exemple précédent, (Propre, Propre) est plus attractif, mais rien ne garantit qu’on y converge sans coordination. Si chaque équipe redoute d’être la seule à jouer Propre pendant que l’autre joue Vite, la prudence peut ramener tout le monde vers (Vite, Vite). Ce n’est pas « irrationnel », c’est une gestion du risque.

Repérer des équilibres multiples revient à repérer plusieurs intersections de meilleures réponses. Ensuite, les bonnes questions sont très concrètes : qui décide en dernier, quel canal de communication existe, quel engagement est crédible, quel calendrier impose une coordination. En entreprise, cela se traduit souvent par des jalons, des comités, ou des validations formelles.

Note utile : certains jeux n’ont aucun équilibre pur. Ce n’est pas un bug, c’est un signal. Votre méthode s’arrête proprement, et vous annonce que vous devez autoriser des stratégies mixtes pour retrouver une stabilité.

Pour mieux comprendre les décisions stratégiques, notre article sur la matrice McKinsey peut offrir des perspectives intéressantes.

Infographie éducative illustrant l'équilibre de Nash avec équipes, matrice de gains et concepts clés en stratégie.
Équilibre de Nash : l’expliquer sans jargon, avec exemples

Quand il n’y a pas d’équilibre pur : calculer une stratégie mixte (sans magie)

Quand aucune case n’est stable en pur, on autorise chaque joueur à randomiser entre ses actions selon des probabilités. Dit comme ça, cela paraît abstrait, mais l’idée est simple : éviter d’être exploitable.

Le principe : rendre l’autre indifférent (et pourquoi c’est logique)

Une stratégie mixte attribue une probabilité \(p\) à une action et \(1-p\) à l’autre. On fait ça quand toute action pure donne prise à une contre-stratégie adverse. C’est typique dans des situations de rivalité directe, ou de négociation répétée où la prévisibilité coûte cher.

L’idée clé est contre-intuitive mais très logique : au mixte d’équilibre, votre adversaire doit être indifférent entre ses options pertinentes. S’il avait une option strictement meilleure, il la choisirait, et votre mélange ne serait pas stable. On choisit donc \(p\) de façon à égaliser ses gains attendus entre ses actions.

Dans la pratique, on ne « tire » pas toujours au hasard de manière explicite. On imite la randomisation via des règles simples, par exemple alterner, ou varier selon un signal interne. Cela fonctionne tant que l’autre perçoit une imprévisibilité suffisante.

Attention toutefois : dans certaines organisations, « randomiser » est limité par des contraintes juridiques, éthiques ou procédurales. Un manager ne peut pas faire n’importe quoi « une fois sur deux » si une politique interne impose une règle fixe.

Exemple chiffré : calcul complet d’un mixte en 2×2

Prenons un jeu classique à somme nulle, sans équilibre en stratégie pure :

B \ AGaucheDroite
GaucheA:1 / B:-1A:-1 / B:1
DroiteA:-1 / B:1A:1 / B:-1

Aucune case n’est stable : quel que soit le choix, l’autre a intérêt à changer. On cherche donc une stratégie mixte. Soit \(p\) la probabilité que A joue Gauche (et \(1-p\) qu’il joue Droite).

Calculons le gain attendu de B s’il joue Gauche. Si A joue Gauche (probabilité \(p\)), B obtient -1 ; si A joue Droite (probabilité \(1-p\)), B obtient 1. Le gain attendu vaut donc \(-1 \cdot p + 1 \cdot (1-p) = 1 – 2p\).

Calculons maintenant le gain attendu de B s’il joue Droite. Si A joue Gauche, B obtient 1 ; si A joue Droite, B obtient -1. Le gain attendu vaut \(1 \cdot p + (-1) \cdot (1-p) = 2p – 1\).

On rend B indifférent : \(1 – 2p = 2p – 1\). On obtient \(4p = 2\), donc \(p = 0{,}5\). A mélange moitié Gauche, moitié Droite, et par symétrie B fait de même. La stabilité vient de l’impossibilité d’exploiter une régularité.

Mini-exercice corrigé + erreurs classiques à éviter

Exercice rapide : reprenez le tableau ci-dessus et imaginez que la diagonale vaut +2 pour A et -2 pour B, tandis que hors diagonale vaut -1 pour A et +1 pour B. Quel est \(p\) ?

On pose encore l’indifférence de B. S’il joue Gauche, son gain attendu vaut \(-2 \cdot p + 1 \cdot (1-p) = 1 – 3p\). S’il joue Droite, son gain attendu vaut \(1 \cdot p + (-2) \cdot (1-p) = 3p – 2\). Égalité : \(1 – 3p = 3p – 2\), donc \(6p = 3\), et \(p = 0{,}5\).

Erreurs fréquentes : on égalise les mauvaises quantités, ou on rend indifférent le mauvais joueur. Autre piège : confondre « égaliser des probabilités » et « égaliser des gains attendus ». Enfin, si vous trouvez \(p < 0\) ou \(p > 1\), ce n’est pas « une probabilité bizarre », c’est le signe qu’une action est dominée et que le mélange doit être recalculé sur les actions réellement pertinentes.

Le point important, au-delà du calcul, est l’intuition : dans ces jeux, l’équilibre n’est pas un choix fixe, c’est une discipline d’imprévisibilité. Et cette imprévisibilité n’a rien de mystique : elle sert juste à empêcher l’autre de vous prendre systématiquement à contre-pied.

Foire aux questions

Qu’est-ce que l’équilibre de Nash en termes simples ?

L’équilibre de Nash est une situation où aucun joueur ne peut améliorer son résultat en changeant seul sa stratégie, tant que les autres gardent la leur. C’est un point de stabilité locale qui ne garantit pas la meilleure solution collective, mais où chacun agit rationnellement face aux choix des autres.

Pourquoi un équilibre de Nash peut-il être insatisfaisant pour tous les participants ?

Parce qu’il ne reflète que la stabilité individuelle, un équilibre peut être socialement sous-optimal. Chacun évite de changer seul par peur de perdre, même si une meilleure coordination collective existerait, ce qui explique souvent des blocages ou compromis médiocres en entreprise.

Comment repère-t-on un équilibre de Nash dans une matrice de gains ?

On identifie les meilleures réponses de chaque joueur face aux choix adverses, puis on cherche les cases où ces meilleures réponses se croisent. Si aucune déviation unilatérale n’améliore le gain d’un joueur, la case correspond à un équilibre en stratégies pures.

Quelle différence y a-t-il entre stratégie dominante, meilleure réponse et Pareto-optimalité ?

Une stratégie dominante est la meilleure quoi qu’il arrive, la meilleure réponse dépend du choix adverse, et Pareto-optimal signifie qu’on ne peut améliorer un joueur sans en pénaliser un autre. Un équilibre de Nash peut ne pas être Pareto-optimal ni impliquer une stratégie dominante.

Que se passe-t-il quand il n’existe pas d’équilibre en stratégies pures ?

Dans ce cas, on cherche un équilibre en stratégies mixtes où les joueurs randomisent leurs choix selon des probabilités. Cela crée une situation où chaque joueur rend l’autre indifférent entre ses options, empêchant toute exploitation systématique d’une stratégie fixe.

Photo of author
Rédigé par
Claire
Je suis spécialisée en recrutement et en ressources humaines. J’analyse les pratiques de sourcing, les processus d’embauche et les évolutions du marché de l’emploi afin d’en proposer une lecture claire et structurée. Mon objectif est d’apporter des repères fiables pour mieux comprendre les enjeux du recrutement.

Laisser un commentaire