Firma stworzyła zbiór danych o nazwie Project CodeNet, który zawiera 14 milionów próbek o łącznej objętości 500 milionów
Autorzy wykorzystali kod dwóch Japończykówkonkursy programistyczne: Aizu i AtCoder. Uczestnicy musieli napisać w nich kod niezbędny do przekształcenia danego zestawu danych wejściowych w zestaw pożądanych wyników dla 4000 różnych problemów. W rezultacie powstało 14 milionów próbek kodu, z czego połowa działała.
IBM planuje uczynić projekt standardowym zestawem danych do szkolenia modeli sztucznej inteligencji, które potrafią rozpoznawać strukturę programów.
Planowane jest użycie CodeNet do stworzeniainteligentne narzędzia programistyczne, które wyszukują niezbędne procedury w aplikacjach i bibliotekach, tłumaczą z jednego języka programowania na inny, wybierają właściwe implementacje i odfiltrowują niewłaściwe, klasyfikują kod i tak dalej.
Czytaj więcej
Reakcje jądrowe nasiliły się w reaktorze elektrowni jądrowej w Czarnobylu
Naukowcy wykazali, jak czarna dziura rozrywa gwiazdę
Fizycy stworzyli analogię czarnej dziury i potwierdzili teorię Hawkinga. Dokąd to prowadzi?