Compania a creat un set de date numit Project CodeNet, care conține 14 milioane de mostre cu un volum total de 500 de milioane
Autorii au folosit cod din două japonezeconcursuri de programare: Aizu și AtCoder. Participanților li sa cerut să scrie codul necesar pentru a transforma un anumit set de intrări într-un set de ieșiri dorite pentru 4.000 de probleme diferite. Rezultatul a fost 14 milioane de mostre de cod, dintre care jumătate funcționau.
IBM intenționează să facă din proiect un set de date standard pentru instruirea modelelor de AI care pot recunoaște structura programelor.
CodeNet este planificat să fie utilizat pentru a creainstrumente inteligente de dezvoltare care caută procedurile necesare în aplicații și biblioteci, traduc de la un limbaj de programare la altul, aleg implementările corecte și filtrează cele greșite, clasifică codul etc.
Citeste mai mult
Reacțiile nucleare s-au intensificat în reactorul centralei nucleare de la Cernobâl
Oamenii de știință au arătat cum o gaură neagră sfâșie o stea
Fizicienii au creat un analog al unei găuri negre și au confirmat teoria lui Hawking. Unde duce?