{"id":15124,"date":"2017-11-09T13:04:50","date_gmt":"2017-11-09T11:04:50","guid":{"rendered":"http:\/\/www.oezratty.net\/wordpress\/?p=15124"},"modified":"2017-11-13T13:24:03","modified_gmt":"2017-11-13T11:24:03","slug":"consequences-pratiques-alphago-zero","status":"publish","type":"post","link":"https:\/\/www.oezratty.net\/wordpress\/2017\/consequences-pratiques-alphago-zero\/","title":{"rendered":"Les cons\u00e9quences pratiques d&#8217;AlphaGo Zero"},"content":{"rendered":"<p>La performance de la troisi\u00e8me version d\u2019AlphaGo, dite Zero, annonc\u00e9e en octobre 2017 en a surpris plus d\u2019un. L\u2019IA de DeepMind, la filiale anglaise de Google, s\u2019entrainait toute seule sans donn\u00e9es d\u2019origine humaine autres que les r\u00e8gles de base du jeu de Go. La performance semblait extraordinaire. Elle l\u2019\u00e9tait au regard de la version pr\u00e9c\u00e9dente d\u2019AlphaGo qui s\u2019entrainait en exploitant plus de 150 000 parties de Go jou\u00e9es par des maitres du jeu et avec un double syst\u00e8me de r\u00e9seau de neurones pour l\u2019\u00e9valuation des mouvements et des coups. Cette IA de troisi\u00e8me g\u00e9n\u00e9ration s\u2019\u00e9tait, qui plus est, entrain\u00e9e en seulement trois jours sur trois serveurs de type PC bien moins lourds que les configurations \u00e0 plusieurs racks utilis\u00e9es dans les deux versions pr\u00e9c\u00e9dentes, qu\u2019elle battait \u00e0 plates-coutures.<\/p>\n<p>Je vais essayer de mettre cela en perspective avec d\u2019autres avanc\u00e9es de l\u2019IA, notamment en robotique. Et surtout, vis \u00e0 vis de performances que DeepMind a mis en avant comme des applications potentielles d\u2019AlphaGo Zero comme la simulation du repliement de prot\u00e9ines complexes, l\u2019un des probl\u00e8mes math\u00e9matiques les plus complexes \u00e0 g\u00e9rer qui soit aujourd\u2019hui.<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/Mastering-AlphaGo-witout-Human-Knowl1.jpg\"><img loading=\"lazy\" decoding=\"async\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"Mastering AlphaGo witout Human Knowledge DeepMind Oct2017\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/Mastering-AlphaGo-witout-Human-Knowl1_thumb.jpg\" alt=\"Mastering AlphaGo witout Human Knowledge DeepMind Oct2017\" width=\"297\" height=\"386\" border=\"0\" \/><\/a><\/p>\n<p>La performance de DeepMind AlphaGo Zero est bien document\u00e9e dans <a href=\"https:\/\/deepmind.com\/blog\/alphago-zero-learning-scratch\/\">AlphaGo Zero Learning from Scratch<\/a> ainsi que dans l\u2019article de 43 pages correspondant publi\u00e9 dans Nature. Dans cette revue, l\u2019acc\u00e8s \u00e0 l\u2019article est payant mais on le trouve aussi \u00e0 l\u2019identique sur le site de DeepMind : <a href=\"https:\/\/deepmind.com\/documents\/119\/agz_unformatted_nature.pdf\">Mastering the game of Go without human knowledge<\/a>. Une analyse des parties d\u2019<a href=\"https:\/\/www.youtube.com\/watch?v=QprlFINq9co\">AlphaGo Zero<\/a> est m\u00eame disponible sur YouTube.<\/p>\n<p>Et voici le genre de r\u00e9action d\u2019\u00e9tonnement que la performance a pu g\u00e9n\u00e9rer :\u00a0<a href=\"https:\/\/medium.com\/intuitionmachine\/the-strange-loop-in-alphago-zeros-self-play-6e3274fcdd9f\">Why AlphaGo Zero is a Quantum Leap Forward in Deep\u00a0Learning<\/a> de Carlos Perez ou\u00a0<a href=\"https:\/\/medium.com\/@vincentpintederegnaucourt\/la-nouvelle-performance-dalphago-est-dingue-4afa3fc4ee2d\">La nouvelle Performance d\u2019AlphaGo est DINGUE &#8211; Maintenant, il cr\u00e9e de la connaissance ex nihilo. Et ce que cela augure est profond<\/a>, de Vincent Pinte-Deregnaucourt (20 octobre 2017). L\u2019auteur se demande comment cette performance serait applicable aux lois de la physique, du droit ou des conventions sociales. Une tr\u00e8s bonne question ! Qui alimente au passage le vieux d\u00e9bat sur l\u2019Intelligence Artificielle Etroite, ad-hoc, qui n\u2019est pas facile \u00e0 r\u00e9pliquer dans d\u2019autres domaines. Et nous allons voir pourquoi.<\/p>\n<p>J\u2019\u00e9tais particuli\u00e8rement intrigu\u00e9 par cette affirmation lue sur le site de DeepMind : \u201c<em>While it is still early days, AlphaGo Zero constitutes a critical step towards this goal. If similar techniques can be applied to other structured problems, such as <strong>protein folding<\/strong>, reducing energy consumption or searching for revolutionary new materials, the resulting breakthroughs have the potential to positively impact society<\/em>\u201d. Le repliement de prot\u00e9ines ? C\u2019est le Graal absolu de la recherche biom\u00e9dicale alors que gagner au jeu de Go ne sert pas \u00e0 grand chose dans la vie courante, \u00e0 part, remettre en question l\u2019ego et le savoir pluri-mill\u00e9naire des grands joueurs de Go en Asie ! Si DeepMind arrivait \u00e0 faire progresser ce domaine, elle ferait faire des bonds immenses \u00e0 la recherche dans la sant\u00e9. Je vais y revenir en d\u00e9tail dans cet article.<\/p>\n<p>Conceptuellement, et \u00e0 haut niveau, l\u2019approche d\u2019AlphaGo Zero n\u2019est pas trop complexe \u00e0 comprendre. Le jeu de Go comprend des r\u00e8gles tr\u00e8s simples de positionnement des jetons. Sa simulation est complexe car la combinatoire des coups est tr\u00e8s \u00e9lev\u00e9e. ll est plus difficile qu\u2019aux \u00e9checs de tester tous les coups possibles pour trouver le bon parcours de jeu. L\u2019IA a donc pour mission d\u2019\u00e9laguer l\u2019arbre de d\u00e9cision des positions en supprimant le plus efficacement les branches mortes, celles qui ne peuvent pas mener \u00e0 la victoire et en privil\u00e9giant celles qui ont le plus de chances d\u2019y mener. Dans AlphaGo Zero, cet \u00e9lagage s\u2019appuie sur l\u201dex\u00e9cution d\u2019un r\u00e9seau de neurones d\u2019apprentissage par renforcement pour chaque coup possible. Le syst\u00e8me s\u2019est d\u2019abord entrain\u00e9 contre lui-m\u00eame et en jouant 4,9 millions de parties. Il a alors jou\u00e9 contre la version pr\u00e9c\u00e9dente d\u2019AlphaGo Zero entrain\u00e9e de son c\u00f4t\u00e9 par une combinaison associant notamment l\u2019exploitation de 150 000 parties existantes, d\u2019origine humaine. Ici, le syst\u00e8me \u00e9tait \u00e0 la fois plus rapide et plus efficace sans exploiter ces parties pr\u00e9existantes.<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/AlphaGo-Zero.jpg\"><img loading=\"lazy\" decoding=\"async\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"AlphaGo Zero\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/AlphaGo-Zero_thumb.jpg\" alt=\"AlphaGo Zero\" width=\"466\" height=\"406\" border=\"0\" \/><\/a><\/p>\n<p>Bref, nous avons une IA qui apprend toute seule sans avoir besoin de donn\u00e9es d\u2019entrainement. Est-ce g\u00e9n\u00e9ralisable facilement ? Est-ce le d\u00e9but d\u2019une IA g\u00e9n\u00e9raliste ? En fait, on en est encore loin. Comment d\u2019ailleurs fonctionne une IA qui n\u2019a pas besoin de donn\u00e9es d\u2019entrainement ? Quelles sont les r\u00e8gles et les informations utilis\u00e9es par l\u2019IA ? Comment le monde est-il mod\u00e9lis\u00e9 et simulable ? C\u2019est une question d\u2019univers ferm\u00e9 ou ouvert, et de probl\u00e8mes discrets ou continus, bref, une question d\u00e9pendant de la nature des r\u00e8gles et \u00e9l\u00e9ments math\u00e9matiques qui r\u00e9gissent le fonctionnement d\u2019un syst\u00e8me complexe.<\/p>\n<p>Pour simplifier les choses, nous allons illustrer la question avec trois types de r\u00e8gles : les r\u00e8gles discr\u00e8tes avec une combinatoire finie, les r\u00e8gles continues avec une combinatoire infinie, et les r\u00e8gles d\u00e9duites implicitement des syst\u00e8mes car ceux-ci ne sont pas mod\u00e9lisables par des r\u00e8gles explicites, ce qui est le cas pour ce qui rel\u00e8ve du vivant en g\u00e9n\u00e9ral et du comportement des consommateurs en particulier.<\/p>\n<p><strong>R\u00e8gles discr\u00e8tes et combinatoire finie<\/strong><\/p>\n<p>Ces r\u00e8gles discr\u00e8tes sont exploit\u00e9e dans les jeux de soci\u00e9t\u00e9 (dames, \u00e9checs, Go). Le principe de base des solutions d\u2019IA pour gagner \u00e0 ces jeux consiste \u00e0 \u00e9lagage d\u2019une mani\u00e8re ou d\u2019une autre un arbre de d\u00e9cision de taille finie.<\/p>\n<p>Pour sortir d\u2019un labyrinthe parfait, on tourne toujours vers la gauche ou vers la droite et \u00e0 un moment donn\u00e9, la topologie du labyrinthe fait que l\u2019on trouve la sortie. Ce n\u2019est pas forc\u00e9ment optimal mais cela marche. La r\u00e8gle d\u2019\u00e9lagage est simple et m\u00eame binaire. Dans le cas du jeu de Go, la r\u00e8gle est celle du placement des pions et de la mani\u00e8re de battre l\u2019adversaire en entourant ses positions.<\/p>\n<p>Dans les jeux de soci\u00e9t\u00e9 comme le tic-tac-toe, les dames, les \u00e9checs, ou le Go, les r\u00e8gles d\u00e9finissent la grille de jeu, la vari\u00e9t\u00e9 des pions et les r\u00e8gles de leur d\u00e9placement. Le jeu de Go a des r\u00e8gles plus simples parce qu\u2019il n\u2019existe que deux types de pions, les blancs et les noirs, et une r\u00e8gle d\u2019encerclement des pions adverses, mais la combinatoire est plus \u00e9lev\u00e9e qu\u2019aux \u00e9checs, simplement parce que l\u2019aire de jeu est plus grande, et les r\u00e8gles de positionnement des pions plus libres.<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/Regles-Echecs-vs-Go.jpg\"><img loading=\"lazy\" decoding=\"async\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; margin: 10px 0px 10px 10px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"Regles Echecs vs Go\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/Regles-Echecs-vs-Go_thumb.jpg\" alt=\"Regles Echecs vs Go\" width=\"468\" height=\"162\" border=\"0\" \/><\/a><\/p>\n<p>Yann LeCun l\u2019explique bien dans <a href=\"https:\/\/www.theverge.com\/2017\/10\/26\/16552056\/a-intelligence-terminator-facebook-yann-lecun-interview\">Facebook\u2019s head of AI wants us to stop using the Terminator to talk about AI<\/a> (octobre 2017) : <em>\u201cSo, AlphaGo is using reinforcement learning. And reinforcement learning works for games; <strong>it works for situations where you have a small number of discrete actions<\/strong>, and it works because it <strong>requires many, many, many trials to run anything complex. <\/strong>AlphaGo Zero has played millions of games over the course of a few days or few weeks, which is possibly more than humanity has played at a master level since Go was invented thousands of years ago. This is possible because <strong>Go is a very simple environment <\/strong>and you can simulate it at thousands of frames per second on multiple computers. [&#8230;] But <strong>this doesn\u2019t work in the real world because you cannot run the real world faster than real time<\/strong>.\u201d.<\/em><\/p>\n<p>Certains s\u2019amusent parfois \u00e0 comparer le nombre de parties possibles du jeu de Go avec le nombre d\u2019atomes dans l\u2019Univers, ce qui est impressionnant mais n\u2019a aucun sens. Ce ne sont pas des donn\u00e9es comparables ! Une combinatoire de positions n\u2019est pas homoth\u00e9tique \u00e0 un nombre d\u2019objets ou d\u2019atomes ! L\u2019association d\u2019id\u00e9e a tendance \u00e0 gonfler les capacit\u00e9s d\u2019AlphaGo. Or une IA ne peut pas simuler des syst\u00e8mes ultra-complexes \u00e0 l\u2019\u00e9chelle atomique, comme un \u00eatre vivant ou l\u2019ensemble d\u2019une plan\u00e8te. La combinatoire est alors plusieurs ordres de grandeur d\u2019ordres de grandeur sup\u00e9rieurs \u00e0 celle du jeu de Go !<\/p>\n<p>Il existe une variante de cette cat\u00e9gories de r\u00e8gles, toujours avec des r\u00e8gles discr\u00e8tes et une combinatoire finie, mais int\u00e9grant une incertitude li\u00e9e \u00e0 une information incompl\u00e8te sur le jeu des adversaires. C\u2019est le cas du jeu de Poker. La performance de deux IA ayant gagn\u00e9 au Poker est de ce point de vue plus \u00e9tonnante que celle d\u2019Alpha Go Zero, avec d\u2019un c\u00f4t\u00e9 <strong>Libratus <\/strong>et de l\u2019autre <strong>DeepStack<\/strong>. Toutes les deux ont \u00e9t\u00e9 annonc\u00e9es en 2017 mais leurs auteurs sont moins efficaces en marketing que Google et DeepMind !<\/p>\n<p>Les probl\u00e8mes de ce type ne sont pas nombreux dans la vie pratique. Il s\u2019agit essentiellement des jeux de soci\u00e9t\u00e9, les premiers syst\u00e8mes auxquels se sont attaqu\u00e9es des g\u00e9n\u00e9rations enti\u00e8res de chercheurs en IA.<\/p>\n<p>Il en existe cependant qui font partie du champ de l\u2019IA depuis sa naissance, et surtout depuis les ann\u00e9es 1980 : les syst\u00e8mes experts \u00e0 base de moteurs de r\u00e8gles et de solveurs ! Ceux-ci exploitent des r\u00e8gles en g\u00e9n\u00e9ral discr\u00e8tes et une combinatoire finie de ces r\u00e8gles pour trouver une solution optimale \u00e0 partir d\u2019une question pos\u00e9e. Les m\u00e9canismes de r\u00e9solution de probl\u00e8mes font partie des solveurs, qui exploitent des techniques dites de chainage avant ou arri\u00e8re. Ils n\u2019utilisent pour l\u2019instant pas encore les r\u00e9seaux de neurones ou le deep learning car il semble que ce n\u2019est pas efficace. Certains moteurs de r\u00e8gles peuvent \u00eatre aliment\u00e9s par des r\u00e8gles identifi\u00e9es de mani\u00e8re empirique \u00e0 partir de l\u2019analyse de donn\u00e9es terrain et de techniques de machine learning pour les donn\u00e9es et de deep learning pour ce qui est du traitement du langage.<\/p>\n<p><strong>R\u00e8gles continues et combinatoire infinie<\/strong><\/p>\n<p>Un second type de probl\u00e8mes de combinatoires \u00e0 traiter est celui de r\u00e8gles que l\u2019on peut qualifier de \u201ccontinues\u201d. On les retrouve en particulier dans la physique des mat\u00e9riaux, la chimie, et le fameux repliement des prot\u00e9ines dans leur forme tertiaire voire quaternaire qui est \u00e9voqu\u00e9 \u00e0 la fin de l\u2019article de DeepMind sur AlphaGo Zero. Je vais creuser un peu ce sujet.<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/Repliement-de-proteines.jpg\"><img loading=\"lazy\" decoding=\"async\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"Repliement de proteines\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/Repliement-de-proteines_thumb.jpg\" alt=\"Repliement de proteines\" width=\"570\" height=\"235\" border=\"0\" \/><\/a><\/p>\n<p>Les prot\u00e9ines sont fabriqu\u00e9es par les ribosomes dans les cellules et \u00e0 partir de l\u2019assemblage en continu de 21 acides amin\u00e9s diff\u00e9rents. L\u2019encodage de ces acides amin\u00e9 provient de la lecture de brins d\u2019ARN messagers issus de la copie de morceaux de l\u2019ADN des chromosomes que l\u2019on appelle les g\u00eanes. Chaque acide amin\u00e9 est reli\u00e9 au pr\u00e9c\u00e9dent par une liaison chimique avec un degr\u00e9 de libert\u00e9 qui se mesure par une orientation spatiale et un angle de rotation. Un nouvel acide amin\u00e9 va former un angle avec le pr\u00e9c\u00e9dent dans un sens ou dans l\u2019autre en fonction des forces d\u2019attraction ou de r\u00e9pulsion des autres atomes de la prot\u00e9ine sachant que celles-ci vont \u00e9voluer au gr\u00e9 de la cr\u00e9ation de la prot\u00e9ine apr\u00e8s l\u2019ajout de cet acide amin\u00e9. Les acides amin\u00e9s ont naturellement tendance \u00e0 cr\u00e9er des structures g\u00e9om\u00e9triques comme des h\u00e9lices dans la structure secondaire des prot\u00e9ines. Dans la structure tertiaire, la prot\u00e9ine atteint son \u00e9quilibre g\u00e9om\u00e9trique et dans la structure quaternaire, des entit\u00e9s s\u00e9par\u00e9es sont assembl\u00e9es pour cr\u00e9er une mol\u00e9cule complexe [voir cette int\u00e9ressante explication dans <a href=\"https:\/\/misciwriters.com\/2017\/02\/14\/how-to-fold-and-misfold-a-protein-part-1\/\">How to Fold (and Misfold) a Protein<\/a>\u00a0et sa <a href=\"https:\/\/misciwriters.com\/2017\/03\/14\/computing-levinthals-paradox-protein-folding-part-2\/\">seconde partie<\/a>, de Sarah Kearns, f\u00e9vrier 2017].<\/p>\n<p>.<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/Proteins-folding-structures.jpg\"><img loading=\"lazy\" decoding=\"async\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; margin: 10px 0px 10px 10px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"Proteins folding structures\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/Proteins-folding-structures_thumb.jpg\" alt=\"Proteins folding structures\" width=\"503\" height=\"258\" border=\"0\" \/><\/a><\/p>\n<p>C\u2019est le cas des histones autour desquelles l\u2019ADN s\u2019enroule dans les chromosomes, des ribosomes qui sont un assemblage de plus de 70 prot\u00e9ines et de quatre brins complexes d\u2019ARN et de tout un tas de prot\u00e9ines complexes que l\u2019on trouve dans les cellules ou de l\u2019ATPase, une prot\u00e9ine complexe situ\u00e9e dans les mitochondries qui convertit l\u2019ADP en ATP, cette derni\u00e8re \u00e9tant la source \u00e9nerg\u00e9tique principale du m\u00e9tabolisme des cellules.<\/p>\n<p>Le repliement d\u2019une prot\u00e9ine va conditionner sa fonction, \u00e0 savoir son interaction avec les autres prot\u00e9ines et enzymes des cellules. Un d\u00e9ficit de certaines prot\u00e9ines peut \u00eatre \u00e0 l\u2019origine de la maladie d\u2019Alzheimer. Savoir comment cr\u00e9er des g\u00eanes qui fabriqueront des prot\u00e9ines pouvant s\u2019attaquer \u00e0 diff\u00e9rentes pathologies extra- ou intra-cellulaires est donc tr\u00e8s int\u00e9ressant. On peut se d\u00e9finir une cible de prot\u00e9ine \u00e0 attaquer dont on connait la forme primaire mais pas forc\u00e9ment tertiaire. Il faut donc pouvoir la d\u00e9duire de sa formule qui est une suite d\u2019acides amin\u00e9s conditionn\u00e9e par le code ADN de ses g\u00eanes, pour d\u00e9terminer les zones \u00e0 toucher et ensuite concevoir une prot\u00e9ine de synth\u00e8se via du g\u00e9nie g\u00e9n\u00e9tique, et l\u2019implanter \u00e9ventuellement dans les chromosomes de cellules vivantes gr\u00e2ce aux fameux ciseaux \u00e0 ADN CRISP-Cas9. Pour fabriquer cette nouvelle prot\u00e9ine, il faut pouvoir en d\u00e9terminer sa composition et son repliement. Donc, en gros, pour cr\u00e9er une th\u00e9rapie \u00e0 base de prot\u00e9ine de synth\u00e8se, il faut id\u00e9alement pouvoir simuler et la ou les prot\u00e9ines cibl\u00e9es et la prot\u00e9ine d\u2019attaque. Aujourd\u2019hui, on ne sait pas le faire et tout rel\u00e8ve d\u2019exp\u00e9rimentations laborieuses et de bio-mim\u00e9tisme.<\/p>\n<p>Les lois physiques associ\u00e9es au repliement des prot\u00e9ines sont connues au niveau atomique avec les liaisons covalentes o\u00f9 des atomes partagent des \u00e9lectrons comme dans les liaisons hydrog\u00e8ne-hydrog\u00e8ne ou hydrog\u00e8ne-oxyg\u00e8ne, les attractions-r\u00e9pulsions ioniques ou les forces de Van der Vals qui r\u00e9gissent la mani\u00e8re dont les parties des prot\u00e9ines interagissent entre elles. Ces forces sont antagonistes et leur \u00e9quilibre est difficile \u00e0 d\u00e9terminer par un simple calcul. La forme que prend une prot\u00e9ine est d\u00e9termin\u00e9e par la recherche d\u2019un \u00e9quilibre\u00a0 \u00e9nerg\u00e9tique optimum sachant qu\u2019elle est baign\u00e9e dans un environnement en g\u00e9n\u00e9ral aqueux, qui ajoute des interactions ioniques diverses avec les mol\u00e9cules d\u2019eau, certaines parties des prot\u00e9ines \u00e9tant hydrophobes et d\u2019autres hydrophiles [voir <a href=\"https:\/\/www2.eecs.berkeley.edu\/Pubs\/TechRpts\/2017\/EECS-2017-104.pdf\">Solving for Minimum Energy Structures with Neural Networks<\/a> de Brian Barch and Norman Tubman, 2017].<\/p>\n<p>On arrive aujourd\u2019hui \u00e0 simuler num\u00e9riquement le repliement d\u2019\u00e0 peine quelques acides amin\u00e9s de peptides, qui sont des petites prot\u00e9ines. Or les prot\u00e9ines qui constituent le gros du fonctionnement de nos cellules et de leurs membranes peuvent comprendre plusieurs centaines voire milliers d\u2019acides amin\u00e9s.<\/p>\n<p>La d\u00e9termination du repliement des prot\u00e9ines ne rel\u00e8ve pas de la recherche dans un arbre de d\u00e9cision comme dans le jeu de Go. On peut \u00e9ventuellement s\u2019appuyer sur un r\u00e9seau de neurones de deep learning, mais on ne sait pas forc\u00e9ment comment l\u2019entrainer car on manque de donn\u00e9es d\u2019exemples. De nombreux chercheurs travaillent sur cette \u00e9pineuse question et depuis des ann\u00e9es, avec des progr\u00e8s r\u00e9guliers.<\/p>\n<p>Il existe une autre voie, plus long terme. Ce genre de simulation sera peut-\u00eatre un jour \u00e0 la port\u00e9e d\u2019ordinateurs quantiques qui pr\u00e9sentent la sp\u00e9cificit\u00e9 de pouvoir simuler plusieurs \u00e9tats simultan\u00e9ment dans un syst\u00e8me complexe, et pas n\u00e9cessairement avec des mod\u00e8les math\u00e9matiques du type de ceux du deep-learning. Nous aurons l\u2019occasion d\u2019en reparler en 2018 car le sujet est florissant et passionnant.<\/p>\n<p>Bref, le repliement des prot\u00e9ines est un sujet \u00e9pineux et strat\u00e9gique. Si DeepMind arrive \u00e0 le traiter, ce sera tr\u00e8s bien et m\u00eame r\u00e9volutionnaire avec des implications incommensurables dans le secteur de la sant\u00e9. Mais DeepMind ne le fera pas forc\u00e9ment avec la m\u00eame m\u00e9thode que celle qui est mise en oeuvre dans AlphaGo Zero.<\/p>\n<p><strong>R\u00e8gles d\u00e9duites implicitement dans des syst\u00e8mes ouverts et complexes<\/strong><\/p>\n<p>Dans le monde du vivant et dans l\u2019environnement, les forces \u00e9l\u00e9mentaires de la physique se combinent avec des niveaux de complexit\u00e9 et de combinatoire tr\u00e8s \u00e9lev\u00e9s. Que ce soit pour conditionner les comportement des individus, les \u00e9volutions de la m\u00e9t\u00e9o, les maladies ou de nombreux autres ph\u00e9nom\u00e8nes naturels.<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/Regles-et-IA.jpg\"><img loading=\"lazy\" decoding=\"async\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"Regles et IA\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/Regles-et-IA_thumb.jpg\" alt=\"Regles et IA\" width=\"531\" height=\"264\" border=\"0\" \/><\/a><\/p>\n<p>Les logiciels et l\u2019IA ne peuvent pas facilement simuler ce monde r\u00e9el car il est trop complexe. Ils se contentent donc d\u2019identifier des r\u00e8gles inconnues par l\u2019exploitation des donn\u00e9es issues de l\u2019observation de l\u2019environnement et avec divers capteurs. Le machine learning et le deep learning identifient ces r\u00e8gles implicites qui associent par un exemple un profil type de client \u00e0 un comportement, ou une image d\u2019objet \u00e0 son nom.<\/p>\n<p>Dans la biologie, le machine learning permet de d\u00e9terminer d\u2019\u00e9ventuelles corr\u00e9lations entre les mutations du g\u00e9nome et l\u2019apparition de cancers divers, ou encore, entre les habitudes alimentaires, la pollution et l\u2019apparition de ces m\u00eames cancers. Ce sont des corr\u00e9lations mais pas forc\u00e9ment des causalit\u00e9s, ce qui explique les limites de la m\u00e9decine dite pr\u00e9dictive. Elle pr\u00e9voit \u00e9ventuellement mais ne permet pas forc\u00e9ment de traiter les pathologies. Pour gu\u00e9rir les patients, il faut inventer des traitements et les corr\u00e9lations ne suffisent pas. On peut juste limiter les facteurs de risques.<\/p>\n<p>Pour revenir \u00e0 mon obsession du repliement des prot\u00e9ines, des m\u00e9thodes d\u2019\u00e9valuation du repliement des prot\u00e9ines en structure tertiaire utilisent des r\u00e9seaux de neurones r\u00e9currents et \u00e0 m\u00e9moire qui utilisent des r\u00e8gles empiriques (RNN, LSTM, voir <a href=\"https:\/\/arxiv.org\/abs\/1701.08318\">Deep Recurrent Neural Network for Protein Function Prediction from Sequence<\/a> de Xueliang Leon Liu, 2017). Ces r\u00e9seaux de neurones sont entra\u00een\u00e9s avec des bases de prot\u00e9ines dont on connait d\u00e9j\u00e0 la structure tertiaire, qui a \u00e9t\u00e9 identifi\u00e9e avec des techniques d\u2019observation utilisant la cristallographie \u00e0 rayons X, la m\u00eame technique utilis\u00e9e par <strong>Rosalind Franklin <\/strong>en 1953 pour d\u00e9terminer la structure en h\u00e9lice de l\u2019ADN, expliqu\u00e9e dans <a href=\"https:\/\/www.youtube.com\/watch?time_continue=222&amp;v=F342GNLXsxA\">cette vid\u00e9o<\/a>.<\/p>\n<p>Ce sont des m\u00e9thodes probabilistes et pas de la simulation des lois physiques gouvernant la position des atomes des mol\u00e9cules les uns vis \u00e0 vis des autres. Dans ce cas-l\u00e0, les r\u00e8gles de repliement des prot\u00e9ines sont donc d\u00e9duites de mani\u00e8re implicite par l\u2019observation. La science est construite \u00e0 partir d&#8217;une combinaison d&#8217;observations, d&#8217;\u00e9laboration de r\u00e8gles et th\u00e9ories \u00e9labor\u00e9es a priori ou v\u00e9rifi\u00e9es a posteriori par l&#8217;observation, et affin\u00e9es si besoin est.<\/p>\n<p>Les IA peuvent apprendre par elles-m\u00eame dans un environnement ouvert en interagissant avec le monde physique, ce que font certains robots avanc\u00e9s qui t\u00e2tonnent et apprennent de mani\u00e8re autonome \u00e0 manipuler des pi\u00e8ces. C\u2019est de l\u2019apprentissage par renforcement applicable \u00e0 un monde ouvert.<\/p>\n<p>Enfin, il existe des probl\u00e8mes tellement complexes qu\u2019ils n\u2019ont pas de solution formelle, relevant du principe d\u2019ind\u00e9cidabilit\u00e9 du th\u00e9or\u00e8me de G\u00f6del. C\u2019est par exemple le cas de l\u2019optimisation parfaite d\u2019un mix marketing. Cette optimisation parfaite est impossible et ind\u00e9cidable car l\u2019environnement est tr\u00e8s dynamique, il comporte trop d\u2019inconnue et l\u2019univers du probl\u00e8me n\u2019est pas facilement simulable. Les outils et leurs r\u00e8gles changent sans cesse. Cela impose de se mettre en permanence en posture d\u2019exp\u00e9rimentation. On peut mesurer l\u2019efficacit\u00e9 d\u2019une solution prise isol\u00e9ment, mais pas optimiser l\u2019usage de l\u2019ensemble des solutions dans leur environnement.<\/p>\n<p><strong>L\u2019IA, l\u2019Homme et les r\u00e8gles complexes<\/strong><\/p>\n<p>Arriver \u00e0 distinguer le niveau de performance de l\u2019IA compar\u00e9e \u00e0 l\u2019Homme est un \u00e9pineux d\u00e9bat. Il existe des domaines o\u00f9 elle d\u00e9passe d\u00e9j\u00e0 largement les capacit\u00e9s humaines (<em>ci-dessous<\/em>, en vert) et d\u2019autres o\u00f9 elle est encore en-deca.<\/p>\n<p>Les jeux sont un domaine o\u00f9 les IA sont d\u00e9j\u00e0 devant l\u2019Homme car ils fonctionnent sur des r\u00e8gles simples o\u00f9 la combinatoire est certes \u00e9lev\u00e9e mais finie. La combinaison de la force brute des machines et des techniques probabilistes d\u2019\u00e9lagage d\u2019arbre de d\u00e9cision font l\u2019affaire.<\/p>\n<p>La vision est un domaine o\u00f9 l\u2019IA d\u00e9passe d\u00e9j\u00e0 les capacit\u00e9s humaines, notamment dans la vision sp\u00e9cialis\u00e9e que constitue l\u2019interpr\u00e9tation de r\u00e9sultats d\u2019imagerie m\u00e9dicale. Et encore, ce niveau de performance est atteint, comme dans celui de la conduite autonome, qu\u2019avec des images dont la r\u00e9solution est g\u00e9n\u00e9ralement r\u00e9duite \u00e0 224&#215;224 pixels. L\u2019\u0153il capte de son c\u00f4t\u00e9 100 millions de pixels par \u0153il ! Cela cr\u00e9\u00e9 un \u00e9norme d\u00e9calage qualitatif. Lorsque la puissance des prochaines g\u00e9n\u00e9rations de processeurs neuromorphiques augmentera, cela permettra de faire tourner des r\u00e9seaux de neurones convolutionnels (ou convolutifs, les deux appellations \u00e9tant couramment utilis\u00e9es) avec une bien meilleure r\u00e9solution. Et la vision artificielle s\u2019am\u00e9liorera encore !<\/p>\n<p>Le traitement du langage est le domaine qui est encore en retrait par rapport aux capacit\u00e9s humaines, m\u00eame la traduction automatique qui est encore tr\u00e8s imparfaite. Mais si vous ne connaissez pas le japonais, le traducteur fran\u00e7ais-japonais est \u00e9videmment meilleur que vous ! Il faut donc distinguer la comparaison entre l\u2019IA et un humain en particulier et avec l\u2019ensemble des humains en g\u00e9n\u00e9ral. Ce d\u2019autant plus que le savoir ing\u00e9r\u00e9 par les IA est presque toujours un savoir composite issu d\u2019un grand nombre d\u2019humains.<\/p>\n<p>C\u00f4t\u00e9 \u00e9nerg\u00e9tique, l\u2019Homme et la vie en g\u00e9n\u00e9ral ont encore quelques points d\u2019avance. Le cerveau ne consomme que 20 W et le corps environ 100 W au repos. Une IA ne fait pas grand chose avec seulement 20 W, qui correspondent \u00e0 la consommation \u00e9lectrique d\u2019un laptop convertissant des photos RAW en JPEG sous Lightroom (<em>c&#8217;est pr\u00e9cis isn&#8217;t it ?<\/em>). Les trois serveurs d\u2019AlphaGo Zero doivent probablement consommer au minimum 1000 \u00e0 2000 W. Les premi\u00e8res moutures consommaient plus de 20 KW.<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/IA-vs-Homme-Scorecard.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"IA vs Homme Scorecard\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/WindowsLiveWriter\/Comprendre-limpact-dAlpha-Go-Zero_73E9\/IA-vs-Homme-Scorecard_thumb.jpg\" alt=\"IA vs Homme Scorecard\" width=\"594\" height=\"302\" border=\"0\" \/><\/a><\/p>\n<p>Ce qui est indiqu\u00e9 en rouge dans le sch\u00e9ma n\u2019est cependant pas <em>th\u00e9oriquement <\/em>inaccessible aux IA. Il est probable que des progr\u00e8s significatifs seront r\u00e9alis\u00e9s dans les ann\u00e9es \u00e0 venir, au moins dans la traduction, la maitrise du langage et le raisonnement g\u00e9n\u00e9raliste. L\u2019agilit\u00e9 physique g\u00e9n\u00e9rale en robotique fera aussi des progr\u00e8s. Ceux-ci ne d\u00e9pendent pas que de l\u2019IA. Ils sont aussi li\u00e9s aux progr\u00e8s dans la m\u00e9canique, les capteurs, les moteurs et les batteries, qui sont plus lents \u00e0 \u00e9merger que dans l\u2019IA.<\/p>\n<p>Ces domaines o\u00f9 l\u2019IA est encore en retrait par rapport \u00e0 l\u2019Homme correspondent finalement aux aspects de la vie qui ne reposent pas sur des r\u00e8gles simples ! Ce qui permet de boucler en beaut\u00e9 ce petit papier de circonstance en vous rassurant un peu sur votre devenir !<\/p>\n","protected":false},"excerpt":{"rendered":"<p>La performance de la troisi\u00e8me version d\u2019AlphaGo, dite Zero, annonc\u00e9e en octobre 2017 en a surpris plus d\u2019un. L\u2019IA de DeepMind, la filiale anglaise de Google, s\u2019entrainait toute seule sans donn\u00e9es d\u2019origine humaine autres que les r\u00e8gles de base du jeu de Go. La performance semblait extraordinaire. Elle l\u2019\u00e9tait au regard de la version pr\u00e9c\u00e9dente [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1909,2659,7,5],"tags":[2990,2658,2644,2991,2992,2965],"class_list":["post-15124","post","type-post","status-publish","format-standard","hentry","category-composants-loisirs-numeriques","category-intelligence-artificielle","category-logiciels","category-technologie","tag-alphago-zero","tag-deepmind","tag-intelligence-artificielle","tag-proteines","tag-repliement-de-proteines","tag-reseaux-convolutionnels"],"views":35932,"_links":{"self":[{"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/posts\/15124","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/comments?post=15124"}],"version-history":[{"count":0,"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/posts\/15124\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/media?parent=15124"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/categories?post=15124"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/tags?post=15124"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}