La empresa creó un conjunto de datos al que llamó Proyecto CodeNet, que contiene 14 millones de muestras con un volumen total de 500 millones.
Los autores utilizaron código de dos japoneses.concursos de programación: Aizu y AtCoder. Se pidió a los participantes que escribieran el código necesario para convertir un conjunto determinado de entradas en un conjunto de salidas deseadas para 4.000 problemas diferentes. El resultado fueron 14 millones de muestras de código, la mitad de las cuales funcionaban.
IBM planea hacer del proyecto un conjunto de datos estándar para entrenar modelos de IA que puedan reconocer la estructura de los programas.
Está previsto que CodeNet se utilice para crearherramientas de desarrollo inteligentes que buscan los procedimientos necesarios en aplicaciones y bibliotecas, traducen de un lenguaje de programación a otro, eligen las implementaciones correctas y filtran las incorrectas, clasifican el código, etc.
Lee mas
Se intensifican las reacciones nucleares en el reactor de la central nuclear de Chernobyl
Los científicos han demostrado cómo un agujero negro destroza una estrella
Los físicos han creado un análogo de un agujero negro y han confirmado la teoría de Hawking. ¿A dónde lleva?