Het bedrijf creëerde een dataset genaamd Project CodeNet, die 14 miljoen samples bevat met een totaal volume van 500 miljoen
De auteurs gebruikten code van twee Japannersprogrammeerwedstrijden: Aizu en AtCoder. Deelnemers moesten de code schrijven die nodig was om een gegeven set inputs om te zetten in een set gewenste outputs voor 4.000 verschillende problemen. Het resultaat was 14 miljoen codevoorbeelden, waarvan de helft werkte.
IBM is van plan om van het project een standaard dataset te maken voor het trainen van AI-modellen die de structuur van programma's kunnen herkennen.
CodeNet is gepland om te worden gebruikt omintelligente ontwikkeltools die zoeken naar de nodige procedures in applicaties en bibliotheken, vertalen van de ene programmeertaal naar de andere, de juiste implementaties kiezen en de verkeerde eruit filteren, de code classificeren, enzovoort.
Lees verder
De kernreacties namen toe in de reactor van de kerncentrale van Tsjernobyl
Wetenschappers hebben aangetoond hoe een zwart gat een ster uit elkaar scheurt
Natuurkundigen hebben een analoog van een zwart gat gemaakt en de theorie van Hawking bevestigd. Waar leidt het toe?