Quand des programmes informatiques nous enseignent la valeur de la coopération

Quand des programmes informatiques nous enseignent la valeur de la coopération…

EEDN
February 20, 2025

Dès les prémices de l’ère informatique, il est apparu que faire interagir des programmes numériques pouvait nous en apprendre beaucoup sur les comportements les plus efficaces en matière d’interactions humaines. Si cela peut sembler quelque peu paradoxal, le profil de celui qui est à l’origine de ce constat est tout aussi inattendu, puisqu’il ne s’agit ni d’un informaticien, ni même d’un sociologue ou d’un psychologue, mais bel et bien d’un professeur de science politique, Robert Axelrod, né en 1943 et lauréat du Prix MacArthur en 1987. Ses travaux en la matière ont eu un tel impact qu’il a, à ce jour, été cité dans plus de 5 000 publications scientifiques.

Sa remarquable expérience, généralement évoquée sous le nom de Tournoi d’Axelrod, s’est déroulée en 1979, et nous donne matière à réflexion sur la valeur ajoutée que les nouvelles technologies peuvent apporter à notre réflexion éthique et géopolitique, à l’heure où la transition numérique et l’avènement de l’Intelligence Artificielle déclenchent chez certains de nos contemporains des vocations de néo-luddites. 

En quoi consistait ce Tournoi d’Axelrod? Et tout d’abord, qu’est ce que la Théorie des Jeux, qu’il est venu à la fois nourrir sous un angle inédit et illustrer? La Théorie des Jeux est un domaine des mathématiques qui propose une description formelle d'interactions stratégiques entre des agents agrégats, désignés comme étant des joueurs. Les fondements modernes de cette théorie sont décrits autour des années 1920 par le mathématicien allemand Ernst Zermelo (1871-1953), dans l'article “Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels”, et par son collègue français Émile Borel (1971-1956) dans l'article « La théorie du jeu et les équations intégrales à noyau symétrique ». Elle est  ensuite développée par Oskar Morgenstern (1902-1977) et John von Neumann (1903-1957) en 1944, dans leur ouvrage “Theory of Games and Economic Behavior”. Il s'agissait de modéliser les jeux à somme nulle où la somme des gains de tous les les joueurs est toujours égale à zéro

Depuis 1944, 11  Prix Nobel d'économie ont été décernés à des économistes pour leurs recherches sur la Théorie des Jeux, considérée comme un outil important de la microéconomie, qui trouve aussi des  applications dans les sciences sociales, la science politique, l'analyse stratégique,  ou encore en Théorie des Organisations et en biologie évolutionniste.

Le Tournoi d’Axelrod, approche autant informatique que géopolitique de cette théorie, était donc un tournoi qui mettait en compétition des programmes informatiques autonomes, chacun devant être équipé d’un sous-programme lui permettant de communiquer et d’interagir avec les autres programmes. Un peu à la manière des interactions humaines, donc. L’objectif était simple et limpide : gagner un maximum de points et en perdre un minimum.

Quatorze des collègues universitaires de Robert Axelrod se prêtèrent au jeu, et lui envoyèrent chacun une disquette -rien que ce mot est une séquence nostalgie pour informaticien!- comprenant leur logiciel personnel, correspondant aux spécifications de l’organisateur. Certains logiciels avaient un comportement initial très agressif, et une stratégie consistant à attaquer les autres, leur voler des points, puis passer au suivant. D’autres fuyaient le contact pour éviter de se faire subtiliser des points par un potentiel adversaire. Chaque programme fut opposé 200 fois à chacun de ses concurrents, ce qui constitue un nombre d’interactions difficilement reproductible à l’échelle d’une vie humaine, voire de celle d’une nation, et donc l’équivalent d’un apprentissage de temps long de l’efficacité comparée des différentes stratégies en matière d’échanges.

Sans surprise, les programmes les plus agressifs se montrèrent initialement les plus efficaces, car ils accumulaient rapidement un grand nombre de points. Pourtant, ils se révélèrent peu efficaces à long terme, car les autres logiciels, après avoir compris leur stratégie, les ont contrés. Et puis, la stratégie prédatrice dépend du stock de proies, qui n’est pas forcément illimité. Dans le même temps, les programmes autonomes, fuyant à la fois confrontations et interactions, perdaient peu de points, mais en gagnaient trop peu pour que leur modus operandi puisse les conduire à la victoire… Une sorte d’illustration du mirage de l’isolationnisme... Ni l’agressivité ni la fuite ne se révélant rentables, quelle option restait-il?

Eh bien, il restait celle du logiciel gagnant, nommé CRP, et conçu par le psychologue et mathématicien américain d’origine russe Anatol Rapoport (1911-2007). Il a contribué à la théorie systémique générale et à la modélisation des interactions sociales, ainsi qu’au modèle de contagion stochastique, opposé au paradigme déterministe. L’acronyme CRP résume le comportement du programme : Coopération, Réciprocité, Pardon. Le concept était unique, dans la mesure où, lorsque CRP rencontrait un logiciel étranger, il lui proposait spontanément la coopération, c’est-à-dire de fonctionner ensemble pour être plus efficaces. Si l’autre acceptait, un fonctionnement gagnant-gagnant se mettait en place, les deux logiciels étant alors en mesure d’accumuler des points sans les voler aux autres. Une vraie logique de la victoire éthique, et une illustration flagrante du fait qu’un accord n’est durablement profitable que s’il l’est tout autant du point de vue de l’autre partie prenante !

Si le logiciel, un temps partenaire, se mettait à poignarder CRP dans le processeur pour lui dérober des points, entrait alors en jeu le principe de réciprocité, consistant à rendre coup pour coup, et à aller au plus efficace pour récupérer ses points, afin de lui faire comprendre que la volonté de coopération, qu’on pourrait qualifier de gentillesse, n’est pas faiblesse. Le secret étant que la riposte demeure proportionnelle à l’offense afin que, la réciprocité ayant permis de stopper l’agression, l’agresseur comprenne qu’il n’est pas dans son intérêt de persister dans une attitude belliqueuse. C’est ce qui permet de passer à la troisième phase, celle du pardon, où l’on remet les compteurs à zéro et où l’on propose à nouveau la coopération, dans une logique d’intérêt réciproque bien compris, puisque avancer ensemble permet de le faire plus rapidement et plus efficacement.

Mais l’efficacité plus grande à long terme du programme d’Anatol Rapoport n’est pas la seule leçon à tirer du Tournoi d’Axelrod, puisqu’en plus de s’avérer efficace, CRP s’est avéré contagieux : les programmes concurrents, percevant peu à peu, au fil des interactions, la validité de sa stratégie et sa plus grande efficacité, se sont mis à imiter son comportement, basé sur la coopération, la réciprocité et le pardon.

Force est de constater que, si cette expérience est venue nourrir la Théorie des Jeux, elle n’a guère fait d’émules dans la population générale, et moins encore parmi les élites politiques et économiques à travers le globe ! L’idéal d’un monde où la géopolitique passerait par le prisme du triptyque Coopération - Réciprocité - Pardon peine visiblement à dépasser le stade de la modélisation… Ou peut-être tous les joueurs n’ont-ils tout simplement pas encore joué leur 13 fois 200 parties? Cela donne matière à penser…

Force est de constater, aussi, que le numérique, Intelligence Artificielle comprise, peut avoir beaucoup à nous apporter, y compris sur notre vision des interactions humaines, si nous adoptons des grilles de lecture où l’optimisme prend le pas sur la peur du changement et sur celle de l’inconnu. C’est la philosophie de l’Ecole Européenne du Numérique, où nous savons que la transition numérique peut être une chance pour tous, porteuse d’opportunités professionnelles et de grilles de lecture du monde enrichies et diversifiées.

Notre façon de favoriser l’émergence du principe CRP dans le monde du travail, c’est de proposer à des entreprises de prendre l’engagement moral, matérialisé par la signature de la Charte de la Diversité Numérique, de laisser les mêmes chances aux profils issus de la reconversion qu’à ceux issus d’une formation initiale au sein de leurs équipes informatiques. Sans doute l’une des démarches RSE les plus pertinentes qui soit, puisque contribuer à ce que chacun s’adapte à un marché du travail en constante évolution du fait de l’émergence toujours plus rapide de nouvelles technologies est la meilleure garantie de garder un pourcentage significatif de nos concitoyens à la fois socialement et économiquement productifs et professionnellement épanouis…

Devenez acteur
de votre avenir

Téléphones, ordinateurs et réseaux ont révolutionné notre quotidien. Et si vous transformiez le vôtre ?

Découvrir les programmes
Hands in a keyboard