IBM crée un cadre pour l'enseignement de la programmation IA

La société a créé un ensemble de données appelé Project CodeNet, qui contient 14 millions d'échantillons pour un volume total de 500 millions.

lignes de code dans plus de 55 langages de programmation : de Java, C et Go à COBOL, Pascal et FORTRAN. Cependant, les principaux langages sont C++ et Python : ils représentent les trois quarts du code.

Les auteurs ont utilisé le code de deux japonaisconcours de programmation : Aizu et AtCoder. Les participants devaient écrire le code nécessaire pour transformer un ensemble donné d'entrées en un ensemble de résultats souhaités pour 4 000 problèmes différents. Le résultat était de 14 millions d'échantillons de code, dont la moitié fonctionnait.

IBM prévoit de faire du projet un ensemble de données standard pour la formation de modèles d'IA capables de reconnaître la structure des programmes.

CodeNet devrait être utilisé pour créerdes outils de développement intelligents qui recherchent les procédures nécessaires dans les applications et les bibliothèques, traduisent d'un langage de programmation à un autre, choisissent les bonnes implémentations et filtrent les mauvaises, classifient le code, etc.

Lire la suite

Les réactions nucléaires se sont intensifiées dans le réacteur de la centrale nucléaire de Tchernobyl

Des scientifiques ont montré comment un trou noir déchire une étoile

Les physiciens ont créé un analogue d'un trou noir et confirmé la théorie de Hawking. Où ça mène?