IBM vytvára rámec pre výučbu programovania AI

Spoločnosť vytvorila súbor údajov s názvom Project CodeNet, ktorý obsahuje 14 miliónov vzoriek z celkového počtu 500 miliónov

riadky kódu vo viac ako 55 programovacích jazykoch, od Java, C a Go po COBOL, Pascal a FORTRAN.Hlavnými jazykmi sú však C a Python, ktoré tvoria tri štvrtiny kódu. 

Autori použili kód z dvoch japonských programátorských súťaží: Aizu a AtCoder.Na nich museli účastníci napísať kód potrebný na premenu daného súboru vstupných údajov na množinuVýsledkom bolo 14 miliónov vzorových kódov, z ktorých polovica bola výroba. 

IBM plánuje urobiť z projektu štandardný súbor údajov pre školenie modelov AI, ktorý dokáže rozpoznať štruktúru programov.

Na vytvorenie sa plánuje použiť CodeNetinteligentné vývojové nástroje, ktoré hľadajú potrebné postupy v aplikáciách a knižniciach, prekladajú z jedného programovacieho jazyka do druhého, vyberajú správne implementácie a filtrujú nesprávne, klasifikujú kód atď.

Čítaj viac

Jadrové reakcie sa v reaktore černobyľskej jadrovej elektrárne zintenzívnili

Vedci dokázali, ako čierna diera trhá hviezdu

Fyzici vytvorili analóg čiernej diery a potvrdili Hawkingovu teóriu. Kadiaľ vedie?