Forskare förklarade att artificiell intelligens och maskininlärning har blivit
”Vi behöver vårt eget ImageNet, vilket kanutforska innovativa idéer och spegla dem i olika algoritmer, konstaterade forskarna. - CodeNet är faktiskt ImageNet för datorer. Det är en massiv dataset för att lära AI / ML-system att översätta kod, bestående av 14 miljoner bitar och 500 miljoner rader på över 55 äldre och aktiva språk - från COBOL och FORTRAN till Java, C ++ och Python. "
De förklarade att datasetet är byggt så härpå ett sätt som möjliggör dubbelriktad översättning. Det vill säga, användaren kan ta föråldrad kod, som ofta används i bank och stat, och översätta den till Java och ett annat språk.

Newspeak, interslaviskt och esperanto: hur vetenskapen på konstgjord väg skapar språk
Forskare förklarade att datamängden består avmånga typer av programmeringstävlingar och alla möjliga problem - några mer avancerade, andra mer akademiska. Dessutom har dessa språk använts under det senaste decenniet i många av dessa tävlingar, vars lösningar representerades av tusentals studenter.
Användare kan också köra enskildabitar av kod "för att extrahera metadata och kontrollera resultaten av generativa AI-modeller för korrekthet." Detta gör det möjligt för forskare att programmera motsvarande bitar av kod när de översätter ett programmeringsspråk till ett annat.
Forskarna tillade att deras utveckling är viktig förautomatiserat resonemang och beslutsfattande, med förmågan att förklara dessa beslut. I själva verket är detta samma gren av modellutveckling som datorvision och naturlig språkbehandling.
Läs mer
Intensiteten hos den nya kraftfullaste lasern är jämförbar med solens ljus som faller på jorden.
Fysiker har skapat en analog av ett svart hål och bekräftat Hawkings teori. Vart leder det?
Den första exakta världskartan skapades. Vad är fel med alla andra?