Vedci vysvetlili, že systémy umelej inteligencie a strojové učenie sa stali
"Potrebujeme náš vlastný ImageNet, ktorý môže."skúmali inovatívne nápady a premietli ich do rôznych algoritmov, poznamenali vedci. - CodeNet je v skutočnosti ImageNet pre počítače. Je to rozsiahly súbor údajov na výučbu systémov AI / ML na preklad kódu, ktorý sa skladá zo 14 miliónov blokov a 500 miliónov riadkov vo viac ako 55 starších a aktívnych jazykoch - od COBOL a FORTRAN po Java, C ++ a Python. “
Vysvetlili, že súbor údajov je zostavený taktospôsobom, ktorý umožňuje obojsmerný preklad. To znamená, že používateľ môže použiť zastaraný kód, ktorý sa často používa v bankovníctve a štátnej správe, a preložiť ho do jazyka Java a iného jazyka.

Newspeak, interslovančina a esperanto: ako veda umelo vytvára jazyky
Vedci vysvetlili, že súbor údajov pozostáva zveľa druhov súťaží v programovaní a najrôznejšie problémy - niektoré pokročilejšie, iné viac akademické. Navyše, tieto jazyky sa za posledných desať rokov používali v mnohých z týchto súťaží, ktorých riešenia predstavovali tisíce študentov.
Používatelia môžu tiež bežať jednotlivokúsky kódu „na extrakciu metadát a kontrolu správnosti generatívnych modelov AI.“ To umožní výskumníkom programovať ekvivalentné časti kódu pri preklade jedného programovacieho jazyka do druhého.
Vedci dodali, že ich vývoj je dôležitý preautomatizované uvažovanie a rozhodovanie so schopnosťou vysvetliť tieto rozhodnutia. V skutočnosti ide o rovnaké odvetvie vývoja modelov ako počítačové videnie a spracovanie prirodzeného jazyka.
Čítaj viac
Intenzita nového najsilnejšieho laseru je porovnateľná so svetlom Slnka dopadajúcim na Zem.
Fyzici vytvorili analóg čiernej diery a potvrdili Hawkingovu teóriu. Kadiaľ vedie?
Bola vytvorená prvá presná mapa sveta. Čo je zlé na všetkých ostatných?