Virksomheden skabte et datasæt, det kalder Project CodeNet, som indeholder 14 millioner prøver med et samlet volumen på 500 mio.
Forfatterne brugte kode fra to japanereprogrammeringskonkurrencer: Aizu og AtCoder. I dem skulle deltagerne skrive den nødvendige kode for at omdanne et givet sæt input til et sæt ønskede output for 4.000 forskellige problemer. Resultatet var 14 millioner kodeeksempler, hvoraf halvdelen virkede.
IBM planlægger at gøre projektet til et standarddatasæt til uddannelse af AI-modeller, der kan genkende strukturen af programmer.
CodeNet er planlagt til at blive brugt til at opretteintelligente udviklingsværktøjer, der søger efter de nødvendige procedurer i applikationer og biblioteker, oversætter fra et programmeringssprog til et andet, vælger de rigtige implementeringer og filtrerer de forkerte ud, klassificerer koden osv.
Læs mere
Atomreaktioner intensiverede i reaktoren i Tjernobyl-atomkraftværket
Forskere har vist, hvordan et sort hul river en stjerne i stykker
Fysikere har skabt en analog til et sort hul og bekræftet Hawkings teori. Hvor det fører hen?