IBM skaber et fundament for læring af AI-programmering

Virksomheden skabte et datasæt, det kalder Project CodeNet, som indeholder 14 millioner prøver med et samlet volumen på 500 mio.

linjer kode i mere end 55 programmeringssprog: fra Java, C og Go til COBOL, Pascal og FORTRAN. Hovedsprogene er dog C++ og Python: de tegner sig for tre fjerdedele af koden. 

Forfatterne brugte kode fra to japanereprogrammeringskonkurrencer: Aizu og AtCoder. I dem skulle deltagerne skrive den nødvendige kode for at omdanne et givet sæt input til et sæt ønskede output for 4.000 forskellige problemer. Resultatet var 14 millioner kodeeksempler, hvoraf halvdelen virkede. 

IBM planlægger at gøre projektet til et standarddatasæt til uddannelse af AI-modeller, der kan genkende strukturen af programmer.

CodeNet er planlagt til at blive brugt til at opretteintelligente udviklingsværktøjer, der søger efter de nødvendige procedurer i applikationer og biblioteker, oversætter fra et programmeringssprog til et andet, vælger de rigtige implementeringer og filtrerer de forkerte ud, klassificerer koden osv.

Læs mere

Atomreaktioner intensiverede i reaktoren i Tjernobyl-atomkraftværket

Forskere har vist, hvordan et sort hul river en stjerne i stykker

Fysikere har skabt en analog til et sort hul og bekræftet Hawkings teori. Hvor det fører hen?

Geek Tech Online

Alt om teknologi og gadgets

IBM skaber en ramme for undervisning i AI-programmering