IBM vytváří rámec pro výuku programování AI

Společnost vytvořila datovou sadu nazvanou Project CodeNet, která obsahuje 14 milionů vzorků o celkovém objemu 500 milionů

řádky kódu ve více než 55 programovacích jazycích: od Javy, C a Go až po COBOL, Pascal a FORTRAN. Hlavními jazyky jsou však C++ a Python: tvoří tři čtvrtiny kódu. 

Autoři použili kód ze dvou Japoncůprogramátorské soutěže: Aizu a AtCoder. Účastníci museli napsat kód potřebný k přeměně dané sady vstupů na sadu požadovaných výstupů pro 4 000 různých problémů. Výsledkem bylo 14 milionů vzorků kódu, z nichž polovina byla funkční. 

IBM plánuje vytvořit z projektu standardní datovou sadu pro školení modelů AI, která dokáže rozpoznat strukturu programů.

CodeNet se plánuje použít k vytvořeníinteligentní vývojové nástroje, které hledají potřebné postupy v aplikacích a knihovnách, překládají z jednoho programovacího jazyka do druhého, volí správné implementace a filtrují špatné, klasifikují kód atd.

Přečtěte si více

Jaderné reakce zesílily v reaktoru černobylské jaderné elektrárny

Vědci ukázali, jak černá díra trhá hvězdu

Fyzici vytvořili analogii černé díry a potvrdili Hawkingovu teorii. Kam to vede?