IBM skapar en ram för undervisning i AI-programmering

Företaget skapade en datauppsättning som heter Project CodeNet, som innehåller 14 miljoner prover med en total volym på 500 miljoner

kodrader i mer än 55 programmeringsspråk: från Java, C och Go till COBOL, Pascal och FORTRAN. Huvudspråken är dock C++ och Python: de står för tre fjärdedelar av koden. 

Författarna använde kod från två japanerprogrammeringstävlingar: Aizu och AtCoder. Deltagarna var tvungna att skriva koden som behövdes för att förvandla en given uppsättning ingångar till en uppsättning önskade utgångar för 4 000 olika problem. Resultatet blev 14 miljoner kodexempel, varav hälften fungerade. 

IBM planerar att göra projektet till en standarddataset för utbildning av AI-modeller som kan känna igen programmens struktur.

CodeNet är planerat att användas för att skapaintelligenta utvecklingsverktyg som söker efter nödvändiga procedurer i applikationer och bibliotek, översätter från ett programmeringsspråk till ett annat, väljer rätt implementeringar och filtrerar bort fel, klassificerar koden och så vidare.

Läs mer

Kärnreaktionerna intensifierades i reaktorn i kärnkraftverket i Tjernobyl

Forskare har visat hur ett svart hål sliter sönder en stjärna

Fysiker har skapat en analog av ett svart hål och bekräftat Hawkings teori. Vart leder det?