บริษัทได้สร้างชุดข้อมูลที่เรียกว่า Project CodeNet ซึ่งมีตัวอย่าง 14 ล้านตัวอย่าง รวมทั้งหมด 500 ล้านตัวอย่าง
ผู้เขียนใช้โค้ดจากภาษาญี่ปุ่นสองคนการแข่งขันการเขียนโปรแกรม: Aizu และ AtCoder ผู้เข้าร่วมจะต้องเขียนโค้ดที่จำเป็นในการเปลี่ยนชุดอินพุตที่กำหนดให้เป็นชุดเอาต์พุตที่ต้องการสำหรับปัญหาที่แตกต่างกัน 4,000 รายการ ผลลัพธ์คือตัวอย่างโค้ด 14 ล้านตัวอย่าง ซึ่งครึ่งหนึ่งใช้งานได้ดี
IBM วางแผนที่จะทำให้โครงการเป็นชุดข้อมูลมาตรฐานสำหรับการฝึกอบรมโมเดล AI ที่สามารถจดจำโครงสร้างของโปรแกรมได้
มีการวางแผนที่จะใช้ CodeNet ในการสร้างเครื่องมือการพัฒนาอัจฉริยะที่ค้นหาขั้นตอนที่จำเป็นในแอปพลิเคชันและไลบรารีแปลจากภาษาโปรแกรมหนึ่งไปยังอีกภาษาหนึ่งเลือกการใช้งานที่เหมาะสมและกรองสิ่งที่ไม่ถูกต้องแยกประเภทรหัสและอื่น ๆ
อ่านเพิ่มเติม
ปฏิกิริยานิวเคลียร์รุนแรงขึ้นในเตาปฏิกรณ์ของโรงไฟฟ้านิวเคลียร์เชอร์โนบิล
นักวิทยาศาสตร์ได้แสดงให้เห็นว่าหลุมดำฉีกดวงดาวออกจากกันได้อย่างไร
นักฟิสิกส์ได้สร้างอะนาล็อกของหลุมดำและยืนยันทฤษฎีของ Hawking นำไปสู่ที่ไหน?