Quand les robots coopèrent afin d’apprendre plus vite

deep-reinforcement-learning-for-robotic-manipulationChacun connait le paradoxe du singe savant, quelques milliers de singes qui, placés face à une machine à écrire, finiront par taper l’intégralité d’Hamlet par la force du hasard. Le robot, grâce au Machine Learning peut lui-aussi finir par apprendre à ouvrir une porte à force d’essais/erreurs.

Depuis plusieurs années, les chercheurs ont démontré qu’un robot pouvait apprendre de lui-même un geste simple. Néanmoins, même une tache aussi site d’ouvrir une porte en tournant une poignée, cela demande des heures, voire des jours. Les chercheurs de Google ont imaginé connecter de multiples  robots pour alimenter une intelligence « collective » et surtout apprendre plus vite.

Plusieurs robots interconnectés pour apprendre ensemble


Sergey Levine, de la Google Brain Team, Timothy Lillicrap de DeepMind, et enfin Mrinal Kalakrishnan, roboticien chevronné chez Google ont interconnecté les réseaux neuronaux de 4 robots confrontés à un problème simple : tourner une poignée de porte et ouvrir celle-ci. Comme prévu, cette coopération entre robots a logiquement permis d’accélèrer la phase d’apprentissage du groupe. Les chercheurs ont fait varier l’angle de la porte, et ainsi permet aux robots d’élever la qualité de leur apprentissage. A la fin de l’expérience, les chercheurs estiment que la qualité de cet apprentissage est supérieure à celui qu’un robot seul aurait pu atteindre seul.

Les chercheurs ont ensuite confronté leurs robots a une autre épreuve, celle de pousser divers objets du quotidien disposés sur une table dans un réceptacle. Cette épreuve n’est plus basée sur l’essai/erreur mais vis à mettre en valeur les qualité de perception de l’environnement du robot. Là encore, la coopération entre robots a porté ses fruits. Les chercheurs considèrent le le benchmark dédié à la reconnaissance d’image ImageNet avec plus de 1,5 million d’images nécessiterait plusieurs années d’apprentissage pour un robot seul, alors qu’en faisait coopérer plusieurs, l’apprentissage peut être réalisé en quelques semaines seulement. Outre la vitesse, cet apprentissage à plusieurs permet d’obtenir un apprentissage de meilleure qualité. Les tâches sont encore simples, mais avec l’amélioration des algorithme mais aussi un accroissement du nombre des robots connectés les uns aux autres, ceux-ci pourront développer des compétences bien plus élevées que celles dont ils ont fait preuve jusqu’à aujourd’hui.

deep-reinforcement-learning-for-roboti-manipulation-2 

 

Sources :
« How Robots Can Acquire New Skills from Their Shared Experience », Google Research Blog, 3 octobre 2016
« Deep Reinforcement Learning for Robotic Manipulation », Cornell University Library, 3 octobre 2016

Commentaires Facebook
Twitter Facebook Plusone Pinterest Linkedin
Ce contenu a été publié dans Robotique, avec comme mot(s)-clé(s) , . Vous pouvez le mettre en favoris avec ce permalien.