La société a créé un ensemble de données appelé Project CodeNet, qui contient 14 millions d'échantillons pour un volume total de 500 millions.
Les auteurs ont utilisé le code de deux japonaisconcours de programmation : Aizu et AtCoder. Les participants devaient écrire le code nécessaire pour transformer un ensemble donné d'entrées en un ensemble de résultats souhaités pour 4 000 problèmes différents. Le résultat était de 14 millions d'échantillons de code, dont la moitié fonctionnait.
IBM prévoit de faire du projet un ensemble de données standard pour la formation de modèles d'IA capables de reconnaître la structure des programmes.
CodeNet devrait être utilisé pour créerdes outils de développement intelligents qui recherchent les procédures nécessaires dans les applications et les bibliothèques, traduisent d'un langage de programmation à un autre, choisissent les bonnes implémentations et filtrent les mauvaises, classifient le code, etc.
Lire la suite
Les réactions nucléaires se sont intensifiées dans le réacteur de la centrale nucléaire de Tchernobyl
Des scientifiques ont montré comment un trou noir déchire une étoile
Les physiciens ont créé un analogue d'un trou noir et confirmé la théorie de Hawking. Où ça mène?