CodeNet : une IA pour traduire les langages informatiques chez IBM
Par June Cantillon - Publié le
IBM a profité de son évènement Think 2021 pour annoncer que ses chercheurs avaient conçu un programme capable de traduire les langages de programmation.
Selon la firme d'Armonk, le projet CodeNet pourrait être aux langages de programmation ce qu'est ImageNet à la vision par ordinateur. Le projet est un ensemble de données (14 millions d'extraits de code et 500 millions de lignes provenant de 55 langages de programmation) permettant à des algorithmes d'apprentissage automatique de traduire un langage de programmation en un autre, que ce soit du COBOL, FORTRAN, Java, C++ ou Python.
Selon Ruchir Puri, scientifique en chef d'IBM Research et à l'origine du programme d'intelligence artificielle Watson,
Selon la firme d'Armonk, le projet CodeNet pourrait être aux langages de programmation ce qu'est ImageNet à la vision par ordinateur. Le projet est un ensemble de données (14 millions d'extraits de code et 500 millions de lignes provenant de 55 langages de programmation) permettant à des algorithmes d'apprentissage automatique de traduire un langage de programmation en un autre, que ce soit du COBOL, FORTRAN, Java, C++ ou Python.
Selon Ruchir Puri, scientifique en chef d'IBM Research et à l'origine du programme d'intelligence artificielle Watson,
nous pensons que le traitement du langage naturel et l'apprentissage automatique peuvent être appliqués à la compréhension des langages logiciels en effectuant un raisonnement et une prise de décision automatisés, en étant capables d'expliquer ces décisions, tout comme nous pouvons le faire avec la vision par ordinateur et du côté du traitement du langage naturel. CodeNet pourrait également être mis à profit pour la détection de clones, la correction de code automatisée, ou encore pour générer des séquences entièrement nouvelles, comme ce que fait GPT-3 avec les langues, en sus de ses fonctions de traduction . IBM précise que les données de CodeNet seront rendues publiques afin d'
offrir aux chercheurs du monde entier un accès égal et gratuit.