IBM creează un cadru pentru predarea programării AI

Compania a creat un set de date numit Project CodeNet, care conține 14 milioane de mostre cu un volum total de 500 de milioane

linii de cod în peste 55 de limbaje de programare: de la Java, C și Go la COBOL, Pascal și FORTRAN. Cu toate acestea, principalele limbaje sunt C++ și Python: ele reprezintă trei sferturi din cod. 

Autorii au folosit cod din două japonezeconcursuri de programare: Aizu și AtCoder. Participanților li sa cerut să scrie codul necesar pentru a transforma un anumit set de intrări într-un set de ieșiri dorite pentru 4.000 de probleme diferite. Rezultatul a fost 14 milioane de mostre de cod, dintre care jumătate funcționau. 

IBM intenționează să facă din proiect un set de date standard pentru instruirea modelelor de AI care pot recunoaște structura programelor.

CodeNet este planificat să fie utilizat pentru a creainstrumente inteligente de dezvoltare care caută procedurile necesare în aplicații și biblioteci, traduc de la un limbaj de programare la altul, aleg implementările corecte și filtrează cele greșite, clasifică codul etc.

Citeste mai mult

Reacțiile nucleare s-au intensificat în reactorul centralei nucleare de la Cernobâl

Oamenii de știință au arătat cum o gaură neagră sfâșie o stea

Fizicienii au creat un analog al unei găuri negre și au confirmat teoria lui Hawking. Unde duce?