Un combat 3.0

Quand deux intelligences se défient

alphago

L’intelligence humaine est-elle devenue obsolète ?

La victoire écrasante d’AlphaGo, l’intelligence artificielle (IA) développée par Google, sur Lee Sedol, l’un des meilleurs joueurs de go du monde, en cinq matchs par 4 victoires contre 1 soulève quantité de questions quant au rapport de l’homme face à l’IA. Les jours de l’IH (l’Intelligence Humaine) sont-ils comptés face à l’IA ? Essayons de comprendre la signification de ce moment historique que nous avons pu vivre en direct ces derniers jours, le dernier match ayant été joué mardi 15 mars à Séoul.

Sans titre

Pourquoi le jeu de go ?

Tout d’abord, pourquoi la victoire de l’IA au jeu de go est-elle symbolique ? Après tout, en 1997, l’IA a battu l’homme aux échecs avec la victoire de Deep Blue contre Kazparov.

Tout vient de la subtilité du jeu. Bien que les règles soient extrêmement simples – on peut les enseigner à des enfants – le jeu se joue sur un plateau de 19 par 19 « cases ». Le nombre de coups possibles en début de partie est donc colossal. Pourquoi est-ce un défi pour un ordinateur ? Les ordinateurs savent répéter des opérations à l’infini (c’est pour cela qu’on les a conçus) et ce n’est pas un très grand nombre qui fait peur à un ordinateur. Pour saisir le challenge, il faut comprendre comment fonctionne un programme de jeu de stratégie. À chaque coup que l’ordinateur doit jouer, celui-ci étudie les conséquences du coup (si je joue là, il va jouer là, je vais jouer là, etc.) et détermine la valeur du coup en calculant les chances qu’il a de sortir gagnant. L’ordinateur balaie donc un arbre de possibilités et compte le nombre de branches gagnantes selon le coup et joue le coup qui a le plus de branches gagnantes. Comme les ordinateurs sont très très forts pour faire des choses répétitives, il est vraiment facile de coder un programme qui balaie de manière systématique un arbre de possibilités. Pour les échecs, il y a 20 coups possibles au premier tour. Il y a donc 20 branches à explorer. Dans le cas du jeu de go, il y a 361 coups possibles, soit 361 branches à explorer qui se divisent toutes en 360 branches, etc… ! L’arbre des possibilités est tellement grand qu’il faudrait un temps quasi infini pour le balayer intégralement.
PropositionEditoIAvsIH (3).odt

Mais alors comment les humains font-ils pour décider du coup à jouer ?

Depuis 2 500 ans que les hommes jouent au go, de nombreuses pistes ont été explorées. Cette connaissance fondée sur une expérience transmise sur deux millénaires a abouti à un ensemble de séquences d’ouverture : les josekis qui permettent aux joueurs de décider les premiers coups. D’autre part, à force d’expérience, les joueurs développent une connaissance basée sur la reconnaissance de formes qui leur permettent d’affirmer que telle structure est solide tandis que telle autre est fragile. Ce qui permet au joueur de décider où jouer, privilégiant la défense de ses structures ou l’attaque des structures de l’autre, selon les situations. Lorsqu’on joue au go, cette connaissance est un mélange d’intuition et de connaissance. Au fur et à mesure que le jeu avance et que le nombre de possibilités se réduit, le jeu fait appel à un raisonnement plus rationnel où le joueur « lit » mentalement les séquences possibles et décide des coups à jouer en explorant l’arbre des solutions possibles tel que cela a été décrit ci-dessus. Bien sûr, à ce jeu-là, les ordinateurs sont très très forts. Ainsi, toute la difficulté pour développer un ordinateur capable de battre l’homme est d’implémenter cette capacité typiquement humaine : l’intuition.

Comment les chercheurs de Google ont-ils fait ?

Pour développer AlphaGo, les chercheurs des laboratoires de Google se sont basés sur les réseaux neuronaux capables de faire de l’apprentissage profond. De quoi s’agit-il ? Plutôt que de coder un programme explorant toutes les solutions possibles, les chercheurs ont développé des algorithmes basés sur des réseaux neuronaux capables d’emmagasiner des formes, des structures et évaluant une situation en se basant sur la reconnaissance de ces structures. Le genre d’algorithmes utilisés par Google, Facebook et les autres poids lourds du web pour développer des programmes capables de vous reconnaître sur la photo de la dernière soirée où vous pensiez être incognito. Exactement de la même façon que nous. Depuis notre plus tendre enfance, nous avons appris à reconnaître les visages, les objets, les formes. Cela s’est fait progressivement : petit à petit, à chaque fois que nous avons vu un visage, un certain groupe de neurones s’est activé, de sorte que lorsque nous voyons un visage inconnu et que ce groupe de neurones s’active nous y voyons un visage. C’est la raison pour laquelle nous pouvons voir des visages dans les nuages, les tâches sur un mur, etc.

PropositionEditoIAvsIH (3).odtC’est ce processus automatique qui est à l’œuvre lorsque nous jouons au go. Au fil des parties, nous reconnaissons des structures qui nous permettent de savoir où jouer pour solidifier une situation ou fragiliser l’adversaire. L’algorithme AlphaGo fonctionne exactement de la même façon. Avant de pouvoir jouer contre Lee Sedol, il a fallu qu’AlphaGo passe par une phase d’apprentissage durant laquelle il a « étudié » plusieurs milliers de parties entre professionnels accessibles sur Internet. Cette première phase lui a permis de développer une forme « d’intuition » lui permettant de savoir dans quelle partie de l’arbre des possibilités il doit jouer selon la situation reconnue. Dans une seconde phase, AlphaGo a joué des millions de fois contre lui-même lui permettant d’affiner son réseau neuronal et d’aller au-delà de ce que les humains ont fait.

AlphaGo, une intelligence extra-humaine ?

Lors de cette deuxième phase, AlphaGo a pu explorer des séquences inédites jamais jouées par les joueurs professionnels : de parties contre lui-même en parties contre lui-même, il a exploré des facettes inconnues à l’homme du jeu et a emmagasiné une expérience trans-humaine. Lors des matchs l’opposant à Lee Sedol, les professionnels ont été subjugués par l’audace de certains coups qu’aucun d’entre eux n’avaient envisagés. Ces coups sont propres à AlphaGo et donnent la sensation aux observateurs d’être le fruit d’une intelligence extra-humaine (on ne peut pas dire extra-terrestre puisque qu’AlphaGo est né sur Terre…).PropositionEditoIAvsIH (3).odt

Mais comment Lee Sedol a-t-il pu battre alphago ?

Sur les cinq matchs joués, AlphaGo a abandonné le 4e laissant la victoire à Lee Sedol. Comment cela a-t-il été possible ? AlphaGo ayant finalement l’expérience de tous les jeux professionnels accessibles en ligne plus des millions de parties de niveau professionnel non jouées.

PropositionEditoIAvsIH (3).odt
La conférence de presse après le 4e match qui a vu la victoire de Lee Sedol

AlphaGo a un style de jeu très particulier lié à la façon dont il a été programmé pour choisir ses coups. Entre un coup ayant 75 % de chances de gagner de 20 points et un coup ayant 99 % de chances de gagner d’1 point, AlphaGo va choisir ce deuxième coup alors qu’un professionnel jouera le premier. Cela lui donne un style de jeu plutôt doux, maintenant le jeu toujours à la limite où il est difficile pour le joueur humain d’être sûr de l’issue du match. Lee Sedol a décelé cela et a décidé d’adopter un style de jeu différent dans la 4e partie cherchant à complexifier la situation et exploitant une faille bien connue des programmes du jeu de go. Lorsque la situation est complexe, l’IA peine à « lire » les séquences et a tendance à se laisser entraîner dans des combats dont l’issue au niveau local est favorable à l’IA mais défavorable au niveau global. Certains de ses coups étaient pathétiques du point de vue des professionnels et c’est cette faille que Lee Sedol a exploité. C’est là la force de l’humain face à l’IA : il a su adapter son jeu alors qu’AlphaGo n’a pas eu le temps de s’adapter à Lee Seedol le temps de ces 5 matchs.

Mais la force de l’IA est de ne pas connaître la fatigue. Ainsi, dans la cinquième partie, le jeu a semblé favorable à Lee Sedol pendant 75 % du temps. Mais AlphaGo maintenant un jeu sur la corde où l’issu n’était pas toujours très claire (le fait de choisir des coups à peine gagnant) a fini par avoir Lee Sedol à l’usure, profitant de quelques faiblesses de fin de parties et emportant finalement la victoire.

Au final, est-ce qu’un ordinateur a battu un humain au go ?

Oui et non. Bien sûr, il est incontestable qu’une IA a battu une IH. Mais si l’on regarde de plus près de quoi AlphaGo est fait, les choses ne sont pas si simples. AlphaGo est un algorithme déployé sur un réseau de 1202 processeurs CPU (le coeur de nos ordinateurs) et 176 processeurs graphiques GPU (ceux qui génèrent les univers graphiques de nos jeux favoris). Google a utilisé une portion de son réseau déployé dans le monde entier pour bâtir AlphaGo. C’est donc un réseau d’ordinateur qui a battu un humain. Cela donne aux chercheurs une idée de la puissance de calcul nécessaire pour atteindre des performances analogues à un seul cerveau humain. Il est encore loin le temps où nous aurons à la maison un robot capable d’une telle performance !

 PropositionEditoIAvsIH (3).odt
 Un data centre de Google

Une chronique de Cédric Lémery

Commentaires

commentaires

1 commentaire

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *