- Cooperation-reciprocite-pardon
-
Coopération-réciprocité-pardon
La stratégie Coopération-réciprocité-pardon, plus connue sous le sigle CRP a d’abord été formalisée par le philosophe et psychologue Anatol Rapaport.
En 1974, il déduit l'idée que la manière la plus "efficace" de se comporter vis-à-vis d'autrui était :
1) la Coopération, 2) la Réciprocité, 3) le Pardon.
C'est-à-dire que lorsqu'un individu ou un groupe rencontre un autre individu ou groupe, il a tout intérêt à proposer dans un premier temps l'alliance. Ensuite il importe, selon la règle de réciprocité, de donner à l'autre en fonction de ce que l'on en reçoit. Si l'autre aide, on l'aide ; si l'autre agresse, il faut l'agresser en retour, de la même manière et avec la même intensité. Enfin il faut pardonner et offrir de nouveau la coopération. En 1979, Robert Axelrod, professeur de sciences politiques, organisa un tournoi entre logiciels autonomes capables de se comporter comme des êtres vivants. Une seule contrainte : chaque programme devait être équipé d'une routine de communication, sous-programme lui permettant de discuter et d'interagir avec ses voisins. Robert Axelrod reçut 14 disquettes de programmes envoyés par des collègues universitaires également intéressés par ce tournoi. Chaque programme édictait des lois différentes de comportement (pour les plus simplistes, deux lignes de code de conduite, pour les plus complexes, une centaine), le but étant d'accumuler le maximum de points. Certains programmes avaient pour règle d'exploiter au plus vite leurs voisins, de s'emparer par la force ou la ruse de leurs points, puis de changer rapidement de partenaires pour poursuivre cette accumulation de points. D'autres essayaient de se débrouiller seuls, gardant précieusement leurs points et fuyant tout contact avec ceux susceptibles de les voler. Des règles stipulaient : "Si l'autre est hostile, l'avertir qu'il doit modifier son comportement puis procéder à une punition." Ou encore : "Coopérer puis obtenir des défections-surprise provoquées par un système aléatoire." Chaque programme fut opposé 200 fois à chacun des autres concurrents. Celui d'Anatole Rapaport, équipé du comportement CRP (Coopération-Réciprocité-Pardon), battit tous les autres. Encore plus fort, le programme CRP, placé cette fois au milieu des autres en vrac, s'avéra au début perdant devant les programmes voleurs agressifs, mais finit par être victorieux puis même "contagieux", au fur et à mesure qu'on lui laissait du temps. Les programmes voisins, constatant qu'il était le plus efficace pour accumuler des points, alignèrent en effet leur attitude sur la sienne.
Catégorie : Théorie des jeux
Wikimedia Foundation. 2010.