IBM tworzy podstawę do nauki programowania AI

Firma stworzyła zbiór danych o nazwie Project CodeNet, który zawiera 14 milionów próbek o łącznej objętości 500 milionów

linie kodu w ponad 55 językach programowania: od Java, C i Go po COBOL, Pascal i FORTRAN. Jednak głównymi językami są C++ i Python: stanowią one trzy czwarte kodu. 

Autorzy wykorzystali kod dwóch Japończykówkonkursy programistyczne: Aizu i AtCoder. Uczestnicy musieli napisać w nich kod niezbędny do przekształcenia danego zestawu danych wejściowych w zestaw pożądanych wyników dla 4000 różnych problemów. W rezultacie powstało 14 milionów próbek kodu, z czego połowa działała. 

IBM planuje uczynić projekt standardowym zestawem danych do szkolenia modeli sztucznej inteligencji, które potrafią rozpoznawać strukturę programów.

Planowane jest użycie CodeNet do stworzeniainteligentne narzędzia programistyczne, które wyszukują niezbędne procedury w aplikacjach i bibliotekach, tłumaczą z jednego języka programowania na inny, wybierają właściwe implementacje i odfiltrowują niewłaściwe, klasyfikują kod i tak dalej.

Czytaj więcej

Reakcje jądrowe nasiliły się w reaktorze elektrowni jądrowej w Czarnobylu

Naukowcy wykazali, jak czarna dziura rozrywa gwiazdę

Fizycy stworzyli analogię czarnej dziury i potwierdzili teorię Hawkinga. Dokąd to prowadzi?

Geek Tech w Internecie

Wszystko o technologii i gadżetach

IBM tworzy ramy do nauczania programowania AI