{"id":17249,"date":"2019-03-22T11:16:24","date_gmt":"2019-03-22T10:16:24","guid":{"rendered":"https:\/\/www.oezratty.net\/wordpress\/?p=17249"},"modified":"2019-07-08T13:52:08","modified_gmt":"2019-07-08T12:52:08","slug":"startups-font-elles-de-la-fausse-ia","status":"publish","type":"post","link":"https:\/\/www.oezratty.net\/wordpress\/2019\/startups-font-elles-de-la-fausse-ia\/","title":{"rendered":"Les startups font-elles de la fausse IA ?"},"content":{"rendered":"<p>Un rapport du fonds d\u2019investissement anglais <strong>MMC Ventures<\/strong> \u201c<a href=\"https:\/\/www.stateofai2019.com\/\">State of AI : divergence \u2013 2019<\/a>\u201d publi\u00e9 en f\u00e9vrier 2019 a fait couler un peu d\u2019encre ces derni\u00e8res semaines. Pourquoi donc ? Parce qu\u2019il r\u00e9v\u00e9lait qu\u2019en Europe, 40% des startups d\u2019IA n\u2019utiliseraient pas d\u2019IA dans leur solution. Et bien dites donc ! Les investisseurs \u00e0 l\u2019aff\u00fbt de startups faisant de l\u2019IA se feraient donc berner par les entrepreneurs. Un v\u00e9ritable scandale en perspective ?<\/p>\n<p>L\u2019information \u00e9tait relay\u00e9e dans de nombreux m\u00e9dias comme dans <a href=\"http:\/\/www.lefigaro.fr\/secteur\/high-tech\/2019\/03\/06\/32001-20190306ARTFIG00121-40-des-start-up-europeennes-d-intelligence-artificielle-n-utilisent-pas-d-intelligence-artificielle.php\">40% des start-up europ\u00e9ennes d&#8217;intelligence artificielle n&#8217;utilisent pas d&#8217;intelligence artificielle<\/a> par Elisa Braun, dans le Figaro ou <a href=\"https:\/\/www.novethic.fr\/actualite\/numerique\/intelligence-artificielle\/isr-rse\/pour-les-investisseurs-la-course-a-l-intelligence-artificielle-est-semee-d-embuches-147039.html\">Pour les investisseurs, la course \u00e0 l\u2019intelligence artificielle est sem\u00e9e d\u2019emb\u00fbches<\/a> par Arnaud Dumas sur le site Novethic qui indique que \u201c<em>\u2026toutes les startups revendiquant une composante IA dans leur mod\u00e8le ne sont pas sinc\u00e8res. Sur 2 830 startups europ\u00e9ennes analys\u00e9es, dans lesquelles des fonds ont \u00e9t\u00e9 investis, 40 % n\u2019ont pas en r\u00e9alit\u00e9 de composantes IA dans leur technologie ! MMC Ventures d\u00e9nombre en tout 1 580 startups dont une des technologies de l\u2019intelligence artificielle se trouve au c\u0153ur de la proposition de valeur. 479 d&#8217;entre elles sont localis\u00e9es au Royaume-Uni. C&#8217;est le double des deux autres grands pays porteurs que sont la France avec 217 entreprises et l\u2019Allemagne avec 196 entreprises.<\/em>\u201d. La presse anglosaxonne a relay\u00e9 de m\u00eame l\u2019information comme TheVerge dans <a href=\"https:\/\/www.theverge.com\/2019\/3\/5\/18251326\/ai-startups-europe-fake-40-percent-mmc-report\">Forty percent of \u2018AI startups\u2019 in Europe don\u2019t actually use AI, claims report<\/a> de James Vincent.<\/p>\n<p>Tout ceci m\u2019a bien titill\u00e9 car cela fait quelques ann\u00e9es que je rencontre des startups de l\u2019IA ou examinent ce qu\u2019elles font \u00e0 distance, en particulier pour la cr\u00e9ation et la mise \u00e0 jour de mon ebook \u201cLes usages de l\u2019intelligence artificielle\u201d (<a href=\"https:\/\/www.oezratty.net\/wordpress\/2018\/usages-intelligence-artificielle-2018\/\">derni\u00e8re \u00e9dition<\/a> en novembre 2018). S\u2019il m\u2019arrive bien de tomber sur des startups survendant leur IA, c\u2019est loin d\u2019\u00eatre dans une proportion de 40%, surtout pour celles qui ont r\u00e9ussi \u00e0 se financer et qui ont d\u00e9j\u00e0 des clients.<\/p>\n<p>Arm\u00e9 de patience, je me suis donc lanc\u00e9 dans un petit exercice de <em>fact checking<\/em> de ces affirmations ! Quelques biais de l\u2019\u00e9tude de MMC Ventures m\u00e9ritent d\u2019\u00eatre d\u2019abord relev\u00e9s. Nous allons voir comment nous pouvons nous faire berner par un tel sensationnalisme. Je vais ensuite faire une sorte de zoom arri\u00e8re et tenter de fournir quelques explications sur les erreurs de communications de certaines startups de l\u2019IA.<\/p>\n<p><strong>Un d\u00e9tail non document\u00e9 d\u2019un gros rapport<\/strong><\/p>\n<p>L\u2019information de ce rapport qui confirme une id\u00e9e que nombre d\u2019observateurs se faisaient de l\u2019\u00e9cosyst\u00e8me des startups de l\u2019IA n\u2019\u00e9tait en fait qu\u2019un simple paragraphe, page 99, d\u2019un gros document de 151 pages contenant des g\u00e9n\u00e9ralit\u00e9s de vulgarisation sur ce qu\u2019est l\u2019IA et sur l\u2019\u00e9volution de son adoption dans les entreprises. Il contient notamment un bon topo sur le hardware de l\u2019IA.<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/State-of-AI-report.jpg\"><img loading=\"lazy\" decoding=\"async\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"State of AI report\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/State-of-AI-report_thumb.jpg\" alt=\"State of AI report\" width=\"629\" height=\"375\" border=\"0\" \/><\/a><\/p>\n<p>Le texte est pr\u00e9cis\u00e9ment le suivant : \u201c<em>We individually reviewed the activities, focus and funding of 2,830 purported AI startups in the 13 EU countries most active in AI \u2013 Austria, Denmark, Finland, France, Germany, Ireland, Italy, the Netherlands, Norway, Portugal, Spain, Sweden and the United Kingdom. Together, these countries also comprise nearly 90% of EU GDP. In approximately 60% of the cases \u2013 1,580 companies \u2013 there was evidence of AI material to a company\u2019s value proposition.<\/em>\u201d.<\/p>\n<p>Un simple paragraphe de 8 lignes ! Mais aucune autre information n\u2019est fournie ! Quid de la cr\u00e9ation de cet \u00e9chantillon de 2830 startups ? Sont-ce des startups en recherche de fonds, des startups d\u00e9j\u00e0 financ\u00e9es en amor\u00e7age ? Peut-on avoir la liste des startups analys\u00e9es ? Peut-on savoir quels crit\u00e8res ils ont utilis\u00e9 pour en \u00e9liminer 40% ? Est-ce que ces 40% sont sp\u00e9cifique \u00e0 l\u2019Europe ? Le ph\u00e9nom\u00e8ne se produit-il aussi aux USA ? Le document ne contient aucune r\u00e9ponse \u00e0 ces questions cl\u00e9s.<\/p>\n<p>Les interviews des auteurs indiquent d&#8217;ailleurs que le flag &#8220;IA&#8221; des startups de leur base ne vient pas forc\u00e9ment des startups elles-m\u00eames mais aussi des <em>market maps<\/em> diverses qui ont cas\u00e9 ces startups dans le domaine de l&#8217;IA, &#8230; \u00e0 l&#8217;insu de leur plein gr\u00e9 !<\/p>\n<p>\u00c7a commence tr\u00e8s mal !<\/p>\n<p>J\u2019imagine que cet \u00e9chantillon de 2830 startups est un mix de leur deal flow, \u00e0 savoir les startups qu\u2019ils ont analys\u00e9es dans le cadre de leur veille en tant qu\u2019investisseur, et d\u2019autres sources externes.<\/p>\n<p><strong>Un \u00e9chantillon biais\u00e9 et incomplet<\/strong><\/p>\n<p>J\u2019ai commenc\u00e9 \u00e0 avoir un doute lorsque j\u2019ai d\u00e9couvert la r\u00e9partition du nombre de startups par pays. Elle met en valeur le Royaume-Uni. Et pour cause, le fonds d\u2019investissement MMC Ventures qui en est \u00e0 l\u2019origine est lui-m\u00eame Britannique et bas\u00e9 \u00e0 Londres. Cr\u00e9\u00e9 en 2000, il a financ\u00e9 une centaine de startups \u00e0 ce jour d\u2019apr\u00e8s la Crunchbase. Il a \u00a3220M sous gestion et investit \u00a335M par an. Il est \u201clead investor\u201d sur une cinquantaine de ces investissements.<\/p>\n<p>Conclusion rapide : l\u2019\u00e9tude de MMC Ventures est un (bel) outil marketing de promotion de son activit\u00e9 d\u2019investisseur et au passage de son pays d\u2019origine. En p\u00e9riode de brexitation, il est critique pour l\u2019\u00e9cosyst\u00e8me de startups britannique de bien se valoriser et de continuer \u00e0 attirer capitaux et entrepreneurs !<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/PMC-Europe-AI-Startups.jpg\"><img loading=\"lazy\" decoding=\"async\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"PMC Europe AI Startups\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/PMC-Europe-AI-Startups_thumb.jpg\" alt=\"PMC Europe AI Startups\" width=\"497\" height=\"265\" border=\"0\" \/><\/a><\/p>\n<p>Dans cette r\u00e9partition par pays, on y trouve une premi\u00e8re bizarrerie : ils n\u2019ont \u201cque\u201d 217 startups fran\u00e7aise de l\u2019IA. Or, l\u2019initiative <strong>France Is AI <\/strong>\u2013 qui est maintenant int\u00e9gr\u00e9e dans France Digitale &#8211; en inventorie 335 sur <a href=\"https:\/\/franceisai.com\/startups\">son site<\/a>, donc 54% de plus ! J\u2019ai d\u00e9j\u00e0 plusieurs fois balay\u00e9 la liste de ces 335 startups fran\u00e7aises et j\u2019y retrouve pas mal de startups connues et rares sont celles qui pipotent sur leur usage de l\u2019IA. Si vous en trouvez, allez, l\u00e2chez-vous et d\u00e9noncez-les ! Ce que MMC ne se permet pas de faire nominativement dans son \u00e9tude.<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/France-is-AI.jpg\"><img loading=\"lazy\" decoding=\"async\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"France is AI\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/France-is-AI_thumb.jpg\" alt=\"France is AI\" width=\"470\" height=\"266\" border=\"0\" \/><\/a><\/p>\n<p>Nous avons donc d\u00e9j\u00e0 un biais d\u2019\u00e9chantillon dans l\u2019\u00e9tude : les startups fran\u00e7aises de l\u2019IA sont sous-\u00e9chantillonn\u00e9es et nous ne savons pas pourquoi. Est-ce fait pour valoriser les startups UK qui seraient mieux \u00e9chantillonn\u00e9es ? Comme la liste des startups utilis\u00e9e dans l\u2019\u00e9tude n\u2019est par fournie, difficile de savoir ! Il faut faire confiance. Et comme on ne conna\u00eet pas le crit\u00e8re de s\u00e9lection des startups, on ne peut savoir si certains pays ont \u00e9t\u00e9 d\u00e9savantag\u00e9s ou pas.<\/p>\n<p>Il existe toujours un biais dans la question et l\u2019outil de mesure. Ainsi, si je vous demande quelle est la plus grande unicorn d\u2019origine fran\u00e7aise, vous r\u00e9pondrez Sigfox, Talend, Blabacar ou OVH. Alors qu\u2019en fait, c\u2019est Snowflake, une startup cr\u00e9\u00e9e aux USA par une \u00e9quipe d\u2019entrepreneurs fran\u00e7ais qui propose une solution de gestion d\u2019entrep\u00f4ts de donn\u00e9es dans le cloud. Elle lev\u00e9 $928M avec une valorisation de plus de $3B. Et d\u2019ailleurs, sans IA !<\/p>\n<p><strong>Un d\u00e9finition contestable de ce qu\u2019est l\u2019IA<\/strong><\/p>\n<p>Personne n\u2019est vraiment d\u2019accord sur ce qu\u2019est l\u2019IA ou un produit qui utilise de l\u2019IA. Pour prendre des cas extr\u00eames, nous avons en France d\u2019un c\u00f4t\u00e9 Luc Julia qui consid\u00e8re que l\u2019IA n\u2019existe pas (\u2026 au sens anthropomorphique du terme) et de l\u2019autre, Laurent Alexandre qui consid\u00e8re qu\u2019elle produit des gilets jaunes (m\u00eame l\u2019IA faible d\u2019aujourd\u2019hui). Probablement \u201cdes gilets jaunes\u201d du futur. Faites un rechercher-remplacer de \u201cintelligence artificielle\u201d par \u201ctechnologies\u201d et le papier de Laurent Alexandre prend tout son sens.<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/IA-existe-ou-pas.jpg\"><img loading=\"lazy\" decoding=\"async\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"IA existe ou pas\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/IA-existe-ou-pas_thumb.jpg\" alt=\"IA existe ou pas\" width=\"575\" height=\"314\" border=\"0\" \/><\/a><\/p>\n<p>Je me suis en fait \u00e9trangl\u00e9 en d\u00e9couvrant la mani\u00e8re dont MMC pr\u00e9sentait sa d\u00e9finition de l\u2019IA. Elle est des plus partiale et partielle ! Leur d\u00e9finition \u00e9lague tout bonnement une belle moiti\u00e9 du champ de l\u2019IA, celui de l\u2019IA symbolique au profit de l\u2019IA connexionniste.<\/p>\n<p>Voici donc leur topo :<\/p>\n<p>\u201c<em>Basic AI has existed since the 1950s, via rules-based programs that display rudimentary intelligence in limited contexts. Early forms of AI included \u2018expert systems\u2019 designed to mimic human specialists. Rules-based systems are limited. Many real-world challenges, from making medical diagnoses to recognising objects in images, are too complex or subtle to be solved by programs that follow sets of rules written by people. Excitement regarding modern AI relates to a set of techniques called machine learning, where advances have been rapid and significant. Machine learning is a sub-set of AI. All machine learning is AI, but not all AI is machine learning.\u00a0 Machine learning enables programs to learn through training, instead of being programmed with rules. By processing training data, machine learning systems provide results that improve with experience<\/em>\u201d.<\/p>\n<p>Et l\u2019on retrouve ce sch\u00e9ma ultra-conventionnel mais partiel d\u00e9crivant le champ de l\u2019IA en poup\u00e9es russes, qui \u00e9lague les moteurs de r\u00e8gles, la programmation par contrainte tout comme les r\u00e9seaux multi-agents.<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/MMC-AI-definition.jpg\"><img loading=\"lazy\" decoding=\"async\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"MMC AI definition\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/MMC-AI-definition_thumb.jpg\" alt=\"MMC AI definition\" width=\"543\" height=\"163\" border=\"0\" \/><\/a><\/p>\n<p>A c\u00f4t\u00e9 de la plaque, le rapport de MMC consid\u00e8re dont que l\u2019IA connexionniste du machine learning est \u201cmeilleure\u201d en g\u00e9n\u00e9ral que l\u2019IA symbolique (\u00e0 base de moteurs de r\u00e8gles). Cela rel\u00e8ve d\u2019une m\u00e9connaissance grave de la riche histoire du champ scientifique de l\u2019IA. Tout d\u2019abord, ce que l\u2019on faisait ou fait avec de l\u2019IA symbolique n\u2019est g\u00e9n\u00e9ralement pas faisable avec le deep learning d\u2019aujourd\u2019hui : d\u00e9montrer un th\u00e9or\u00e8me de g\u00e9om\u00e9trie (fait dans les ann\u00e9es 1960), faire un diagnostic m\u00e9dical qui ne rel\u00e8ve pas de l\u2019imagerie (fait dans les ann\u00e9es 1970 avec le syst\u00e8me expert MYCIN), faire de la maintenance industrielle, ou tout simplement faire respecter le code de la route \u00e0 un v\u00e9hicule autonome.<\/p>\n<p>De plus, les chercheurs de l\u2019IA n\u2019ont jamais tent\u00e9 de reconna\u00eetre un chat dans une image avec un moteur de r\u00e8gles. Au pire le faisait-on dans les ann\u00e9es 1990 et 2000 avec du machine learning exploitant des \u201chandcrafted features\u201d comme ils l\u2019expliquent pourtant dans le document.<\/p>\n<p>Il y a bien eu des tentatives d\u2019int\u00e9grer des capacit\u00e9s de raisonnement dans du deep learning, en particulier dans la branche du \u201cSymbolic Neural Networks\u201d. Mais elle n\u2019a pour l\u2019instant pas aboutit sur quelque chose de probant. A ce stade, donc, les outils de l\u2019IA symbolisme, m\u00eame s\u2019ils n\u2019ont plus la cote depuis l\u2019explosion cambrienne du deep learning, sont compl\u00e9mentaire de ce dernier.<\/p>\n<p>Faire apprendre le code de la route pourrait \u00eatre r\u00e9alis\u00e9 avec de l\u2019apprentissage par renforcement mais cela ne serait pas forc\u00e9ment efficace. Il apprendrait en observant les pratiques des automobilistes, qui ne respectent pas toujours le code de la route. Et cet apprentissage d\u00e9pend des pays, est tr\u00e8s lent et peut faire des d\u00e9g\u00e2ts.<\/p>\n<p>En pratique, on utilise encore des moteurs de r\u00e8gles et l\u2019on peut \u00e9ventuellement ajuster la base des r\u00e8gles via de l\u2019apprentissage. C\u2019est aussi comme cela que fonctionnent certaines solutions \u00e0 base d\u2019IBM Watson avec du deep learning pour faire de l\u2019extraction de r\u00e8gles dans des bases de textes libres qui alimentent ensuite des briques logicielles symboliques.<\/p>\n<p>Qu\u2019on se le dise : le deep learning d\u2019aujourd\u2019hui ne raisonne pas. Il exploite des donn\u00e9es avec des mod\u00e8les probabilistes. Il pourra peut-\u00eatre raisonner un jour puisque c\u2019est comme cela que notre cerveau fonctionne. Mais avec une densit\u00e9, un nombre de neurones et une sophistication du fonctionnement des neurones qui vont bien au-del\u00e0 des r\u00e9seaux de neurones de l\u2019IA d\u2019aujourd\u2019hui. On est \u00e0 la fois limit\u00e9 par le mat\u00e9riel qui ne peut pour l\u2019instant g\u00e9rer que des r\u00e9seaux de neurones avec quelques milliards de param\u00e8tres, et par les algorithmes utilis\u00e9s. Sans compter la forme biologique de l&#8217;Homme, ses sens et son interaction avec la nature.<\/p>\n<p><strong>D\u2019autres \u00e9l\u00e9ments de l\u2019\u00e9tude de MMC Ventures<\/strong><\/p>\n<p>L\u2019\u00e9tude de MMC est longue. On y trouve quelques autres informations int\u00e9ressantes mais difficiles \u00e0 interpr\u00e9ter du fait de l\u2019absence de transparence sur le jeu de donn\u00e9es utilis\u00e9es.<\/p>\n<p>Ainsi, la France aurait des projets de startups d\u2019IA plus matures qu\u2019au Royaume Uni ! On le voit dans le graphe ci-dessous qui montre que l\u2019\u00e9chantillon fran\u00e7ais comprend moins de startups en amor\u00e7age (en bleu) qu\u2019au Royaume-Uni. Autre traduction : nous aurions un \u201cpipe\u201d insuffisant de projets de qualit\u00e9. Question de verre \u00e0 moiti\u00e9 plein ou \u00e0 moiti\u00e9 vide !<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/AI-Funding.jpg\"><img loading=\"lazy\" decoding=\"async\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"AI Funding\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/AI-Funding_thumb.jpg\" alt=\"AI Funding\" width=\"531\" height=\"208\" border=\"0\" \/><\/a><\/p>\n<p>Dans une autre perspective, d\u2019un point de vue th\u00e9matique, le Royaume-Uni serait le pays des startups de l\u2019IA dans la sant\u00e9 tandis que la France serait celle des startups de l\u2019IA du service client. C\u2019est possible mais non v\u00e9rifiable. Il est vrai que dans la cartographie de France Is AI, on y trouve pas mal de startups li\u00e9es au retail. Mais on en a aussi pas mal dans la sant\u00e9 et elles n\u2019y sont d\u2019ailleurs pas toutes.<\/p>\n<p><a href=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/UK-vs-France.jpg\"><img loading=\"lazy\" decoding=\"async\" style=\"background-image: none; padding-top: 0px; padding-left: 0px; display: inline; padding-right: 0px; border-width: 0px;\" title=\"UK vs France\" src=\"https:\/\/www.oezratty.net\/wordpress\/wp-content\/UK-vs-France_thumb.jpg\" alt=\"UK vs France\" width=\"482\" height=\"287\" border=\"0\" \/><\/a><\/p>\n<p>Le rapport contient d\u2019autres \u00e9l\u00e9ments cr\u00e9dibles. Ils indiquent ainsi que la proportion des startups qui int\u00e8grent de l\u2019IA dans leurs solutions ne fera qu\u2019augmenter. L\u2019IA est amen\u00e9e \u00e0 se g\u00e9n\u00e9raliser un peu partout, quelle qu\u2019en soit la forme. Il d\u00e9crit ce ph\u00e9nom\u00e8ne, le syndrome de ru\u00e9e vers l\u2019or des investisseurs, qui n\u2019est pas sp\u00e9cifique \u00e0 l\u2019IA et que l\u2019on a connu sur plein d\u2019autres tendances technologiques ces derni\u00e8res d\u00e9cennies.<\/p>\n<p><strong>Une promotion des startups du portefeuille de MMC Ventures<\/strong><\/p>\n<p>Le document de MMC comprend des descriptions format \u201cone pager\u201d pour 14 startups.<\/p>\n<p>Nous avons :<\/p>\n<ul>\n<li><strong>Audio Analytic <\/strong>(UK) ayant lev\u00e9 $8,2M. Elle d\u00e9tecte les anomalies dans des sources audio. Elle est int\u00e9gr\u00e9es dans la Freebox Delta Player lanc\u00e9e en d\u00e9cembre 2018 pour sa fonction de s\u00e9curit\u00e9 pour d\u00e9tecter les intrusions.<\/li>\n<li><strong>Current Health<\/strong> (UK) ayant lev\u00e9 $11,7M, dont une part chez MMC Ventures. C\u2019est de la t\u00e9l\u00e9surveillance de seniors \u00e0 base d\u2019objets connect\u00e9s. Il doit bien y avoir une douzaine de startups faisant quelque chose d\u2019\u00e9quivalent en France.<\/li>\n<li><strong>Digital Genius <\/strong>(UK) ayant lev\u00e9 $26M dont une part chez MMC Ventures. Ils automatisent la cr\u00e9ation de sc\u00e9narios de service clients pour des chatbots.<\/li>\n<li><strong>Gousto <\/strong>(UK) ayant lev\u00e9 $100M, dont une part chez MMC Ventures. Ils utilisent de l\u2019IA, non pr\u00e9cis\u00e9e, pour cr\u00e9er des paniers pour se pr\u00e9parer ses repas.<\/li>\n<li><strong>Kheiron Medical <\/strong>(UK) ayant lev\u00e9 selon la Crunchbase \u00a310K mais probablement plus au vu de la liste des investisseurs. Fait du diagnostic de cancers, pour l\u2019instant du sein. C\u2019est visiblement un concurrent du Fran\u00e7ais Therapixel.<\/li>\n<li><strong>Omni:us <\/strong>(Allemagne), ayant lev\u00e9 23,9M\u20ac propose une solution d\u2019automatisation pour la gestion de sinistres dans les assurances.<\/li>\n<li><strong>Prowler.io<\/strong> (UK) ayant lev\u00e9 $14,9M. Ils font des pr\u00e9dictions \u00e0 base de machine learning. La description de leur offre est particuli\u00e8rement floue comme le sont souvent les startups de ce type.<\/li>\n<li><strong>Seldon <\/strong>(UK) ayant lev\u00e9 $4,3M. Ils font du machine learning dans le cloud. Original !<\/li>\n<li><strong>SenSat <\/strong>(UK) ayant lev\u00e9 $5M. Leur solution sert \u00e0 la conduite de chantiers, mais il est difficile d\u2019identifier les composantes d\u2019IA qu\u2019elle contient.<\/li>\n<li><strong>Senseon <\/strong>(UK) dans la cybers\u00e9curit\u00e9, ayant lev\u00e9 $6,4M, dont une part chez MMC Ventures.<\/li>\n<li><strong>Senseye <\/strong>(UK) ayant lev\u00e9 \u00a34,8M dont une part chez MMC Ventures. Ils font de la maintenance pr\u00e9dictive pour l\u2019industrie.<\/li>\n<li><strong>Signal <\/strong>(UK) ayant lev\u00e9 $26,6M, dont une part chez MMC Ventures. Ils font la curation de contenus textuels.<\/li>\n<li><strong>StoryStream<\/strong> (UK) ayant lev\u00e9 \u00a33M, dont une part chez MMC Ventures. Leur description : \u201c<em>Using patent-pending AI, our solution transforms the carbuying experience by automatically delivering more real, relevant content, at scale, to every customer touchpoint. Our platform enables better lead quality and increased conversion, and improved ROI by driving efficiency into content management across global teams.<\/em>\u201d. Allez v\u00e9rifier l\u2019IA qu\u2019il y a l\u00e0-dedans avec \u00e7a !<\/li>\n<li><strong>Synthesia<\/strong> (UK) avec des investisseurs non document\u00e9s, visiblement uniquement le gouvernement UK. Ils proposent une application int\u00e9ressante et perturbante. Elle permet de faire un doublage de film en en alt\u00e9rant le mouvement des l\u00e8vres des acteurs pour qu\u2019ils collent \u00e0 la langue du doublage. Cela utilise bien de l\u2019IA \u00e0 base de r\u00e9seaux de neurones g\u00e9n\u00e9ratifs. C\u2019est une forme l\u00e9g\u00e8re de \u201cfake news\u201d comme ces fameuses vid\u00e9os fake de Barack Obama qui tiennent des propos enti\u00e8rement artificiels.<\/li>\n<\/ul>\n<p>Au final, nous avons donc 13 startups UK sur 14, et 50% o\u00f9 le fonds MMC Ventures a investi. Traduction : les britanniques sont les rois de l\u2019IA et nous sommes un fonds d\u2019investissement s\u00e9rieux dans l\u2019IA. Les autres fonds sont des rigolos qui se font berner par des entrepreneurs maquillant une base de donn\u00e9es MySQL ou NoSQL en IA.<\/p>\n<p><strong>Quelques points de vigilance des startups de l\u2019IA<\/strong><\/p>\n<p>Je vous livre ici quelques r\u00e9flexions li\u00e9es \u00e0 l\u2019observation de loin et de pr\u00e8s de nombreuses startups de l\u2019IA. L&#8217;IA washing existe bel et bien, mais son origine m\u00e9rite quelques \u00e9claircissements.<\/p>\n<p>Tout d\u2019abord, le syndrome de l\u2019IA bullshit d\u00e9crit par MMC est souvent la <strong>cons\u00e9quence des pratiques marketing <\/strong>du monde des startups. Les acc\u00e9l\u00e9rateurs et autres services d\u2019accompagnement des startups formatent les discours et le marketing des startups pour mettre en avant la \u201cbusiness value\u201d de la solution. Les composantes techniques de la solution sont tr\u00e8s rarement d\u00e9crites dans le marketing. Avec ou sans IA. Les entrepreneurs veulent conserver la main sur leur proc\u00e9d\u00e9. Souvent, ils veulent aussi simplement cacher le fait qu\u2019ils utilisent des m\u00e9thodes d\u2019IA tr\u00e8s standards, disponibles \u201coff the shelf\u201d dans n\u2019importe quel framework tel que TensorFlow. Une startup d\u2019imagerie m\u00e9dicale ne va pas raconter qu\u2019elle encha\u00eene un R-CNN de d\u00e9tourage et de comptage, avec un VGG16 d&#8217;identification puis un classifieur pour d\u00e9tecter des tumeurs canc\u00e9reuses ! Ce sont des techniques courantes. Dans d\u2019autres cas de figure, les startups ne sont pas tr\u00e8s bavardes sur leur solution car elle est en cours de d\u00e9p\u00f4t de brevet. M\u00eame sur des logiciels, qui sont en pratique brevetables d\u00e8s lors qu\u2019ils sont associ\u00e9s \u00e0 un dispositif mat\u00e9riel plus ou moins original.<\/p>\n<p>Il y a aussi de la <strong>fake AI de vraie AI<\/strong>, notamment en robotique. Les d\u00e9monstrations des robots de Boston Dynamics sont en fait t\u00e9l\u00e9command\u00e9es avec une manette de jeu. Le chien Spot Mini ne d\u00e9cide pas tout seul d&#8217;ouvrir une porte et d&#8217;insister pour y arriver. Les d\u00e9monstrations du robot Sophia de Hanson Robotics sont &#8220;stag\u00e9es&#8221;, \u00e0 savoir que les dialogues sont en partie pr\u00e9script\u00e9s. Mais il y a tout de m\u00eame une IA de bas niveau dans ces solutions. Elles sont juste embellies pour les d\u00e9monstrations. C&#8217;est une \u00e9norme tromperie.<\/p>\n<p>Je connais beaucoup d\u2019investisseurs et, s\u2019ils n\u2019ont pas tous un bon bagage technique dans l\u2019IA, ils savent tout de m\u00eame d\u00e9tecter une bonne part du bullshit des entrepreneurs. C\u2019est ce qui fait qu\u2019une bonne part des entrepreneurs en herbe n\u2019arrivent pas \u00e0 se financer, m\u00eame en amor\u00e7age. Ils utilisent souvent des \u201csignaux lat\u00e9raux\u201d comme le pedigree et le parcours des fondateurs. Une startup de l\u2019IA qui n\u2019aurait pas dans ses fondateurs un CTO ayant un historique dans le domaine devrait \u00eatre un \u201cred flag\u201d pour tout investisseur. Une startup de l\u2019IA cr\u00e9\u00e9e par des HEC qui voudrait sous-traiter tous les d\u00e9veloppements logiciels devrait faire de m\u00eame.<\/p>\n<p>On sait que la valeur des IA connexionnistes est la combinaison d\u2019algorithmes, de mat\u00e9riel et de donn\u00e9es. Un investisseur doit donc aussi \u00e9valuer la <strong>source des donn\u00e9es<\/strong> utilis\u00e9es par la startup, leur quantit\u00e9 et leur qualit\u00e9. Cette \u00e9valuation permet indirectement de se faire une id\u00e9e de la g\u00e9n\u00e9ricit\u00e9 de la solution. Plus les donn\u00e9es exploit\u00e9es seront externes aux clients, plus la solution sera g\u00e9n\u00e9rique. Plus les donn\u00e9es seront propres \u00e0 chaque client, plus grand sera le risque que la solution n\u00e9cessite une vente en mode service et\/ou projet. La qualit\u00e9 ou la non qualit\u00e9 des donn\u00e9es explique pourquoi une IA qui s\u2019appuie sur les outils les plus r\u00e9cents peut tr\u00e8s bien ne pas fonctionner. Elle va g\u00e9n\u00e9rer trop d\u2019erreurs, de faux positifs ou n\u00e9gatifs dans des t\u00e2ches de classification. La qualit\u00e9 des donn\u00e9es d\u2019entra\u00eenement explique notamment les d\u00e9boires d\u2019IBM en canc\u00e9rologie avec Watson.<\/p>\n<p>Les briques de base de l\u2019IA sont un Lego g\u00e9ant essentiellement disponible en open source. Une bonne part du travail d\u2019aujourd\u2019hui consiste \u00e0 les choisir et \u00e0 r\u00e9aliser un travail d\u2019int\u00e9gration et d\u2019assemblage. Les \u00e9quipes techniques de la startup doivent de plus en plus ma\u00eetriser une grande vari\u00e9t\u00e9 de ces techniques, relevant ou pas de l\u2019IA : les capteurs, les t\u00e9l\u00e9coms, les ressources du cloud et les interfaces utilisateurs pour ne prendre que les plus courantes. Tr\u00e8s peu de startups cr\u00e9ent de nouvelles briques de l&#8217;IA.<\/p>\n<p>Comme <strong>les briques de l\u2019IA sont devenues des commodit\u00e9s<\/strong>, il est de plus en plus difficile de jauger une startup par rapport \u00e0 ses concurrents. Comme par exemple Kheiron Medical et Therapixels. La diff\u00e9rence entre les deux pourra venir de l\u2019IA, mais le plus souvent, elle viendra de la capacit\u00e9 \u00e0 toucher les bons clients et \u00e0 d\u00e9ployer rapidement. La bataille concurrentielle des startups est un m\u00e9lange de bataille qualitative sur les solutions et une course de vitesse.<\/p>\n<p>Autre point cl\u00e9 : le <strong>manque de r\u00e9f\u00e9rences clients<\/strong> d\u00e9ploy\u00e9es \u00e0 grande \u00e9chelle et document\u00e9es. Une bonne part des startups de l\u2019IA sont assez jeunes, avec quelques ann\u00e9es d\u2019existence. Tr\u00e8s souvent, elles en sont encore au stade des projets pilotes (PoC). Ceux-ci ne donnent pas encore lieu \u00e0 la production d\u2019\u00e9tudes de cas communicables. Surtout quand les PoC (proof of concepts) ne sont pas satisfaisants. Et lorsque les r\u00e9f\u00e9rences sont document\u00e9es, elles se focalisent plus sur la valeur business de la solution que sur ses caract\u00e9ristiques techniques. Il n\u2019existe pas de v\u00e9ritable discipline de r\u00e9f\u00e9rencement d\u2019\u00e9tude de cas de l\u2019IA. Je m\u2019y \u00e9tais essay\u00e9, sans grand succ\u00e8s en 2017 dans <a href=\"https:\/\/www.oezratty.net\/wordpress\/2017\/modele-etude-de-cas-ia\/\">Mod\u00e8le d\u2019\u00e9tude de cas de l\u2019IA<\/a>.<\/p>\n<p>Avec un peu d\u2019exercice, j\u2019arrive souvent \u00e0 identifier la technique d\u2019IA utilis\u00e9e en fonction de la description m\u00e9tier de la solution. Juste en imaginant les donn\u00e9es en entr\u00e9e et les r\u00e9sultats en sortie. Dans le machine learning, la m\u00e9thode utilis\u00e9e d\u00e9pend g\u00e9n\u00e9ralement de la dimensionnalit\u00e9 du probl\u00e8me. S\u2019il ne comprend que quelques dimensions, on utilise des m\u00e9thodes de base du machine learning pour faire de la classification ou de la pr\u00e9vision (SVM, r\u00e9gression non lin\u00e9aire, \u2026). Si le nombre de param\u00e8tres passe \u00e0 quelques dizaines, la solution va probablement faire appel \u00e0 un r\u00e9seau de neurones avec une ou quelques couches cach\u00e9es. Enfin, si la donn\u00e9e est plus complexe, on passera au deep learning. C\u2019est un passage oblig\u00e9 d\u00e8s que l\u2019on traite des images, de la voix, du langage ou du bruit. Un robot, quelle qu\u2019en soit la forme (chatbot, robot humano\u00efde, aspirateur, robotic process automation dans la banque ou l\u2019assurance, \u2026) fera g\u00e9n\u00e9ralement aussi appel \u00e0 un moteur de r\u00e8gles pour l\u2019application de r\u00e8gles d\u00e9j\u00e0 connues.<\/p>\n<p>Un autre sc\u00e9nario peut tr\u00e8s bien intervenir :<strong> celui d&#8217;une startup qui utilise une technologie donn\u00e9e mais qui n&#8217;est pas indispensable<\/strong>. Elle le fera car c&#8217;est effectivement \u00e0 la mode et que cela permet de trouver plus facilement des investisseurs. Cela peut tr\u00e8s bien se produire avec de l&#8217;IA mais aussi, dans d&#8217;autres situations, avec une blockchain. On trouve des applications exploitant la blockchain pour des cas d&#8217;usages de plus en plus farfelus par les temps qui courent !<\/p>\n<p>Enfin, il faudrait citer le cas des <strong>\u00e9diteurs de logiciels existants<\/strong> et les PMEs qui ne sont pas des startups et int\u00e8grent progressivement du machine learning dans leur solution pour exploit\u00e9es les donn\u00e9es qu\u2019elle capte et g\u00e9n\u00e8re. D\u00e8s lors que ces logiciels captent de gros volumes de donn\u00e9es de qualit\u00e9, il pourront ajouter des fonctions de classification et de pr\u00e9diction \u00e0 la solution existante. C\u2019est ce qui est en train d\u2019arriver dans les logiciels de comptabilit\u00e9, dans la cybers\u00e9curit\u00e9, dans les outils de monitoring d\u2019infrastructures informatique (avec les \u201cAIops\u201d), dans les outils de d\u00e9veloppement, etc. Ces entreprises-l\u00e0 n&#8217;appara\u00eessent pas dans les statistiques !<\/p>\n<p>En conclusion, s\u2019il est vrai qu\u2019il y a tout de m\u00eame de l\u2019IA washing chez certaines startups, surtout en phase de pr\u00e9-amor\u00e7age, il ne faut pas prendre les investisseurs pour des demeur\u00e9s. Ils ont des biais mais ont aussi de l\u2019exp\u00e9rience. Ils ne regardent pas que la technologie dans une solution mais la capacit\u00e9 \u00e0 la marketer et \u00e0 la vendre. Ils \u00e9valuent surtout le potentiel des \u00e9quipes.<\/p>\n<p><strong>Bref<\/strong><\/p>\n<p>Nous avons tout de m\u00eame une masse critique de belles startups de l\u2019IA en France : Algolia, Dataiku, Invenis, Prevision.io,\u00a0 Yseop, Shift Technology, Snips, Na\u00efo Robotics (robots agricoles), Alan, DreamQuark, Cardiologs, Therapixels, Visible Patient, etc. Reste \u00e0 les faire d\u00e9coller rapidement \u00e0 l\u2019\u00e9chelle internationale.<\/p>\n<p>Soyez en tout cas m\u00e9fiants lorsqu\u2019un article d\u00e9marre avec \u201cles \u00e9tudes disent que\u2026\u201d ou \u201cdes chercheurs ont trouv\u00e9 que\u2026 ou ont r\u00e9ussi \u00e0&#8230;\u201d. Il se cache souvent derri\u00e8re ces affirmations des \u00e9tudes biais\u00e9es, des statistiques incompl\u00e8tes, des analyses qualitatives d\u00e9ficientes et des biais cognitifs. Y compris d\u2019ailleurs dans les critiques comme les miennes !<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Un rapport du fonds d\u2019investissement anglais MMC Ventures \u201cState of AI : divergence \u2013 2019\u201d publi\u00e9 en f\u00e9vrier 2019 a fait couler un peu d\u2019encre ces derni\u00e8res semaines. Pourquoi donc ? Parce qu\u2019il r\u00e9v\u00e9lait qu\u2019en Europe, 40% des startups d\u2019IA n\u2019utiliseraient pas d\u2019IA dans leur solution. Et bien dites donc ! Les investisseurs \u00e0 l\u2019aff\u00fbt [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[4],"tags":[2833,3215,3216,2832,3213,3214],"class_list":["post-17249","post","type-post","status-publish","format-standard","hentry","category-actualites","tag-deep-learning","tag-ia-connexionniste","tag-ia-symbolique","tag-machine-learning","tag-mmc-ventures","tag-moteurs-de-rregles"],"views":33556,"_links":{"self":[{"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/posts\/17249","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/comments?post=17249"}],"version-history":[{"count":0,"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/posts\/17249\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/media?parent=17249"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/categories?post=17249"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.oezratty.net\/wordpress\/wp-json\/wp\/v2\/tags?post=17249"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}