Actualité

Divers

OpenAI : l'intelligence artificielle apprend à jouer et tricher à cache-cache (vidéo)

Par June Cantillon - Publié le

La société OpenAI, présidée par Elon Musk et Sam Altman, tente de mettre en concurrence ses programmes d'apprentissage automatique afin d'analyser l'évolution de leur comportement.

Comme pour les organismes qui se dépassent, parfois, au sein d'un environnement compétitif, les programmes développent des comportements inattendus lorsqu'ils se retrouvent face à un adversaire de taille (en l'occurence, eux-mêmes). Les chercheurs d'OpenAI ont donc décider de faire jouer les programmes à 500 millions de parties de cache-cache afin d'analyser les stratégies adoptées au fil du temps, et de l'apprentissage.



Les matchs étaient assez simples pendant les premières (25 millions tout de même) parties, avant que les programmes devant se cacher ne décident de bloquer les portes afin que les chercheurs ne puissent les débusquer. Ces derniers prirent 50 millions de parties supplémentaires avant de les déloger en grimpant sur les pièces mobiles afin de passer par dessus les obstacles. Leurs adversaires ont ensuite appris à placer les éléments de manière à empêcher les chercheurs d'escalader leurs barricades.

En continuant à jouer, chacun à trouvé de nouvelles stratégies, comme faire disparaitre les éléments mobiles, ou l'utilisation de certaines dispositions très particulières visant à bloquer ces mêmes éléments. Le but de ces simulations serait de permettre à l'avenir aux IA d'esquisser des solutions inédites, pour des problèmes nettement plus terre à terre.