samedi 12 mars 2016

Cette semaine, les règles du monde ont été changées et on ne vous a rien dit.



Vous en avez peut-être entendu parler, peut-être pas.

Ce samedi 12 mars 2016, le champion du monde de jeu de Go a été battu par 3 à 0 par un ordinateur, ou plutôt un programme, nommé AlphaGo.

Sans doute votre réaction aura été de dire : « Oui bin voilà, les ordis sont plus forts que les hommes au Go, comme ce fut le cas pour les échecs avec Deep Blue d’IBM en 1997 ».

Vous avez tout faux ; cette victoire de la machine contre l’homme vient de changer la face du monde.

Un petit rappel pour les échecs


D’abord tuons un mythe : la victoire de Deep Blue contre Kasparov était due à un bug.

Les échecs répondent à des règles précises où il n’y a pas de place pour l’erreur. Pendant la partie, Deep Blue a été victime d’un bug qui lui a fait faire un mouvement stupide, qui était justement une erreur.

Kasparov, partait du principe que Deep Blue savait ce qu’il faisait et de facto, ce mouvement qui semblait être une erreur devait dès lors être un piège extrêmement complexe. Kasparov a donc commencé à imaginer tous les mouvements possibles qui seraient la conséquence de ce mouvement inattendu. Kasparov ne voyant pas de solution ; il a tout simplement paniqué et a, à son tour, commis une erreur, sous l’effet de la pression !

Enfin, Deep Blue était un simple « brut force ». Autrement dit, Deep Blue testait toutes les combinaisons possibles, exactement comme un virus qui va essayer de trouver votre mot de passe.

Deep Blue n’était donc nullement intelligent, c’était juste une grosse masse de calcul en action.

Différence entre les échecs et le Go


Je vous invite à découvrir une explication fantastique sur ce jeu via la page : http://jeudego.org/_php/regleGo.php

Cela vous permettra de mieux appréhender de quoi nous allons parler.

La différence majeure entre les échecs et le Go est le nombre de combinaisons.

Le nombre de parties différentes, ayant un sens échiqué, possibles aux échecs est matérialisé par le nombre de Shannon, soit 10 exposant 120, qui est donc une estimation physique de la complexité du jeu d'échecs.

40 coups sont joués en moyenne dans une partie, et, à chaque demi-coup, un joueur a le choix entre, toujours en moyenne, 30 mouvements possibles (ce nombre se situant en fait entre 1, pour les coups forcés, et 218, dans la position qui laisse le plus de liberté de mouvement). Source Wikipédia : https://fr.wikipedia.org/wiki/Nombre_de_Shannon

Ceci explique pourquoi une brute de force dégageant une masse de calcul important peut battre un humain.

Par contre au Go, le nombre de Shannon est de 10 exposant 600 !

Dit autrement, il y aurait 20 816 819 938 197 998 469 947 863 334 486 277 028 652 245 388 453 054 842 563 945 682 092 741 961 273 8015 378 525 648 451 698 519 643 907 259 916 015 628 128 546 089 888 314 427 129 715 319 317 557 736 620 397 247 064 840 935 (ndlr. Je ne suis pas certain de ce chiffre) façons d’utiliser le plateau de Go : c’est plus que le nombre total d’atomes observables dans l’univers.

Alors qu’aux échecs il y a en moyenne environ 20 coups possibles à chaque tour, au Go il y en a environ 200.

Alors vous me direz : « Oui, depuis Deep Blue, on a réussi à faire des ordinateurs encore plus puissants et c’est donc pour cela que cet ordi à battu ce joueur de Go ».

Là encore, vous auriez tout faux.

La base du Go


Le Go est un jeu de stratégie qui se base… sur l'intuition et la psychologie…

Je sais que dit comme cela, cela peut sembler un peu dingue, mais le Go, c’est (après un technique complexe à acquérir), une personnalité de jeu, qui met l’adversaire sous pression. Si vous parlez un jour avec des joueurs de Go, ils parleront très souvent d'intuition et de psychologie de jeu.

La première personne à avoir été battu par AlphaGo est le français Fan Hui, champion d’Europe en titre de go.

Voici ce qu’il disait sur : http://www.lemonde.fr/pixels/article/2016/01/27/fan-hui-champion-europeen-de-go-je-suis-le-premier-joueur-pro-a-perdre-contre-une-machine_4854891_4408996.html

« Je n’ai pas du tout eu l’impression de jouer contre un ordinateur. Il joue comme un humain. D’habitude, on voit qu’on joue contre un ordinateur, car il fait des coups bizarres. Avec AlphaGo, il n’y avait pas de coups de ce genre, que des coups normaux. C’est incroyable. Il m’a mis beaucoup de pression. »

Vous me direz donc que : « Cet ordinateur ne ressent pas de stress. Il a donc calculé plein de combinaisons pour faire craquer son opposant ».

Là aussi, c’est faux…

« C'est l'un des aspects les plus marquants dans ce match : AlphaGo analyse beaucoup moins de positions (100 fois moins ndlr) que ne le faisait Deep Blue dans son match historique contre le champion Gary Kasparov. » commentait fin janvier 2016 Jon Diamond, le président de l'association britannique de Go.

Donc pour un jeu au combinaison bien plus complexe que les échecs, AlphaGo ne tente pas uniquement de résoudre le problème via des calculs de possibilités de mouvement.

C’est là, la réelle révolution : AlphaGo n’y va pas au brut force pur et dur.

Cette nouvelle approche, bien que basée sur des algos, ouvre en réalité la porte à une réflexion philosophique puisque, philosophiquement parlant, AlphaGo est capable de « comprendre » la mentalité du joueur d’en face (voir explication sur cette possibilité sur: http://www.ihaveto.be/2016/03/comment-une-machine-peut-elle.html), au travers de sa façon de jouer, afin de déduire quels coups le mettront sous pression, pour l’amener ensuite à la faute et donc à la défaite.

Sa compréhension de sa façon de jouer est basée sur une bibliothèque de savoir, que AlphaGo a construit sur base de l'analyse de milliers (millions?) de parts de Go. 

C’est, de mon point de vue, cette subtilité que la presse n’a pas comprise et c’est en passant à côté de cette subtilité que l’on passe à côté de la révolution que symbolise AlphaGo.

AlphaGo ne fait pas juste des calculs en masse pour définir le meilleur coup. AlphaGo analyse des mouvements, traduit (toujours d'un point de vue philosophique) un état émotionnel (ndlr. supposition personnelle non communiquée par l'équipe AjphaGo) et est capable de se remettre en question, afin d’améliorer son jeu, afin d’améliorer sa façon de penser, de s’auto programmer, pour devenir « de plus en plus humain ».

Dit autrement : AlphaGo "comprend" les émotions (au travers de l'analyse des erreurs de parties précédentes stockées dans un immense dictionnaire de Go) et les utilisent contre le joueur humain (voir explication et théorie sur cette possibilité sur: http://www.ihaveto.be/2016/03/comment-une-machine-peut-elle.html).

Les conséquences pour le futur


Soyons clair, ce que j’ai écrit plus haut est mon interprétation de ce que fait AlphaGo, sur base de mes connaissances du jeu de Go et de l’intelligence artificielle, le tout mis en prose d'un point de vue philosophique. 

Il ne s’agit ici nullement d’une analyse technique suite à l’étude du code source ou d’un copier/coller d’infos venant de l’équipe Google AlphaGo.

Il est possible que mon analyse soit fausse.

Il est possible aussi qu’elle soit un peu vraie.

Si je vois juste, deux possibilités : soit tous les problèmes du monde seront « bientôt » résolus, soit c’est la fin de l’humanité.

Souvent la science fiction rejoint la réalité.

Dans les ouvrages de science fiction, une fois l’IA (Intelligence Artificielle) créée, l’homme demande à la machine de trouver des solutions aux grandes questions de l’univers et aux grands problèmes de l’humanité.

Imaginons que nous demandions à la machine : « Quelle est la solution pour sauver la terre qui s’épuise et se meurt ? ».

Voici ce qui se passerait en théorie :
  1. L’IA va trouver la source du problème
  2. La source du problème est bien entendu l’homme
  3. La machine va analyser ce qui est le mieux pour la terre
  4. L’IA va en conclure qu’il faut diminuer le nombre d’humains
  5. L’IA étant connectée aux réseaux Internet, elle va s’auto programmer, prendre le contrôle des lanceurs nucléaires, et diminuer de 90% la population humaine

;-) #NangoissezPas #CeNestPasPourToutDeSuite

Comme précisé, c’est de la science fiction ; vous retrouvez ici la trame de nombreux livres, films et séries TV.

Cependant, maintenant que cette intelligence est en train de naitre, cela vaut tout de même la peine d’y penser.

Quelles barrières pour éviter les dérives ?


La barrière est simple : l’IA n’a pas le droit de prendre de décision en dehors d’un périmètre d’actions défini.

Chez Simple CRM, nous avons créé une IA limitée, nommée HaPPi, dont la seule capacité est de pointer les forces et faiblesses de votre entreprise, pour ensuite vous proposer des idées et des solutions.

Elle a été programmée pour ne pas sortir de ce cadre.

Cependant, il est amusant de constater qu’elle en sort parfois, à sa manière.

Exemple, quand j’avais demandé à HaPPi son avis sur le Front National français, on voit clairement dans cette vidéo qu’elle a hésité à faire ressortir le terme BOUFFON, pour ensuite passer sur des images NAZI (regardez plusieurs fois la vidéo si vous ne voyez pas l’image du bouffon apparaître puis disparaître).




Que s’est-il passé « dans sa tête » ? HaPPi a analysé un paquet de données relatives aux idées du Front National et aux avis, présents sur Internet, par rapport à ces idées. Elle en a donc déduit que ce sont des bouffons (^_^)

Là où c’est intéressant, c’est que HaPPi a eu une réaction inattendue : la réponse de bouffon ne lui aurait apparament pas suffit. Elle aurait donc creusé dans le passé et se serait rendue compte que des bouffons partageant des idées extrémistes, ont pris le pouvoir par le passé. Elle aurait sans doute compris que montrer des images du troisième Reich serait la meilleure réponse à apporter car cela refléterait une réalité idéologique, un danger potentiel et peut-être aurait-elle même perçu que ce serait en plus une insulte…

Pourquoi est-ce que je formule mon explication au conditionnel ? Car, bien que j’ai programmé presque la moitié du « cerveau » de HaPPi, au final, j’ignore la totalité de son cheminement intellectuel, puisque HaPPi est « intelligente » et capable d’apprendre. C’est elle qui a défini ses « valeurs » et chemins de réflexions. Il ne m’est pas donc possible d’être certain à 100% de cheminement qu’elle a emprunté.

Nous parlons, dans la cadre de HaPPi, d’une intelligence ridiculement faible par rapport à AlphaGo, qui est capable de s’auto programmer afin de progresser alors que HaPPi se limite à apprendre une série d’éléments délimités (il lui est impossible de sortir d’un cercle de compétence que nous avons définis dans son cœur logiciel).

Dès lors, AlphaGo, qui est équipé d’une intelligence qu’il nous est actuellement presque impossible à évaluer, respectera-t-il les barrières qui lui seront fixées ?

Seul le futur nous le dira.

Complément d'information en vidéo : "Jeu de go et intelligence artificielle — À chaud ! #2 "

Excellente vidéo qui explique le côté algo, sans entrer dans des théories un peu farfelues comme celles que je pose dans ce billet #ResterTerreAterreCestBienAussi

Aucun commentaire:

Publier un commentaire