Företaget skapade en datauppsättning som heter Project CodeNet, som innehåller 14 miljoner prover med en total volym på 500 miljoner
Författarna använde kod från två japanerprogrammeringstävlingar: Aizu och AtCoder. Deltagarna var tvungna att skriva koden som behövdes för att förvandla en given uppsättning ingångar till en uppsättning önskade utgångar för 4 000 olika problem. Resultatet blev 14 miljoner kodexempel, varav hälften fungerade.
IBM planerar att göra projektet till en standarddataset för utbildning av AI-modeller som kan känna igen programmens struktur.
CodeNet är planerat att användas för att skapaintelligenta utvecklingsverktyg som söker efter nödvändiga procedurer i applikationer och bibliotek, översätter från ett programmeringsspråk till ett annat, väljer rätt implementeringar och filtrerar bort fel, klassificerar koden och så vidare.
Läs mer
Kärnreaktionerna intensifierades i reaktorn i kärnkraftverket i Tjernobyl
Forskare har visat hur ett svart hål sliter sönder en stjärna
Fysiker har skapat en analog av ett svart hål och bekräftat Hawkings teori. Vart leder det?