Forskere forklarte at kunstig intelligens-systemer og maskinlæring har blitt
“Vi trenger vårt eget ImageNet, som kanutforske innovative ideer og reflektere dem i forskjellige algoritmer, bemerket forskerne. - CodeNet er faktisk ImageNet for datamaskiner. Det er et massivt datasett for å lære AI / ML-systemer å oversette kode, bestående av 14 millioner biter og 500 millioner linjer på over 55 eldre og aktive språk - fra COBOL og FORTRAN til Java, C ++ og Python. "
De forklarte at datasettet er bygget slikpå en måte som muliggjør toveis oversettelse. Det vil si at brukeren kan ta utdatert kode, som ofte brukes i bank og stat, og oversette den til Java og et annet språk.

Newspeak, interslavisk og esperanto: hvordan vitenskapen kunstig skaper språk
Forskere forklarte at datasettet består avmange slags programmeringskonkurranser og alle slags problemer - noen mer avanserte, andre mer akademiske. Dessuten har disse språkene blitt brukt det siste halvannet tiåret i mange av disse konkurransene, hvor løsningene ble representert av tusenvis av studenter.
Brukere kan også kjøre individueltbiter av kode "for å trekke ut metadata og kontrollere resultatene av generative AI-modeller for korrekthet." Dette vil tillate forskere å programmere tilsvarende kodestykker når de oversetter ett programmeringsspråk til et annet.
Forskerne la til at deres utvikling er viktig forautomatisert resonnement og beslutningstaking, med evnen til å forklare disse beslutningene. Faktisk er dette den samme grenen av modellutvikling som datasyn og naturlig språkbehandling.
Les mer
Intensiteten til den nye kraftigste laseren er sammenlignbar med sollyset som faller på jorden.
Fysikere har laget en analog av et svart hull og bekreftet Hawkings teori. Hvor det fører?
Det første nøyaktige kartet over verden ble opprettet. Hva er galt med alle andre?