นักวิทยาศาสตร์อธิบายว่าระบบปัญญาประดิษฐ์และการเรียนรู้ของเครื่องได้กลายเป็น
“ เราต้องการ ImageNet ของเราเองซึ่งสามารถทำได้สำรวจแนวคิดใหม่ ๆ และสะท้อนให้เห็นในอัลกอริทึมต่างๆนักวิจัยตั้งข้อสังเกต - CodeNet คือ ImageNet สำหรับคอมพิวเตอร์ เป็นชุดข้อมูลขนาดใหญ่สำหรับการสอนระบบ AI / ML ในการแปลโค้ดซึ่งประกอบด้วย 14 ล้านชิ้นและ 500 ล้านบรรทัดในภาษาดั้งเดิมและภาษาที่ใช้งานมากกว่า 55 ภาษาตั้งแต่ภาษา COBOL และ FORTRAN ไปจนถึง Java, C ++ และ Python "
พวกเขาอธิบายว่าชุดข้อมูลถูกสร้างขึ้นเช่นนี้ในลักษณะที่อนุญาตให้แปลแบบสองทิศทาง นั่นคือผู้ใช้สามารถนำรหัสที่ล้าสมัยซึ่งมักใช้ในการธนาคารและหน่วยงานราชการและแปลเป็นภาษา Java และภาษาอื่น

Newspeak, Interslavic และ Esperanto: วิทยาศาสตร์สร้างภาษาขึ้นมาได้อย่างไร
นักวิทยาศาสตร์อธิบายว่าชุดข้อมูลประกอบด้วยการแข่งขันการเขียนโปรแกรมหลายประเภทและปัญหาทุกประเภท - บางคนก้าวหน้ากว่าบางคนมีวิชาการมากขึ้น ยิ่งไปกว่านั้นภาษาเหล่านี้ถูกนำมาใช้ในช่วงทศวรรษครึ่งที่ผ่านมาในหลาย ๆ การแข่งขันเหล่านี้โดยมีนักเรียนหลายพันคนนำเสนอคำตอบ
ผู้ใช้ยังสามารถเรียกใช้รายบุคคลส่วนของรหัส "สำหรับการแยกข้อมูลเมตาและตรวจสอบผลลัพธ์ของแบบจำลอง AI ที่สร้างขึ้นเพื่อความถูกต้อง" สิ่งนี้จะช่วยให้นักวิจัยสามารถตั้งโปรแกรมโค้ดที่เทียบเท่ากันได้เมื่อแปลภาษาโปรแกรมหนึ่งไปเป็นอีกภาษาหนึ่ง
นักวิทยาศาสตร์กล่าวเพิ่มเติมว่าการพัฒนาของพวกเขามีความสำคัญสำหรับการให้เหตุผลและการตัดสินใจโดยอัตโนมัติพร้อมความสามารถในการอธิบายการตัดสินใจเหล่านี้ อันที่จริงนี่เป็นสาขาเดียวกับการพัฒนาโมเดลเช่นเดียวกับการมองเห็นของคอมพิวเตอร์และการประมวลผลภาษาธรรมชาติ
อ่านเพิ่มเติม
ความเข้มของเลเซอร์ที่ทรงพลังที่สุดใหม่เทียบได้กับแสงของดวงอาทิตย์ที่ตกลงมาบนโลก
นักฟิสิกส์ได้สร้างอะนาล็อกของหลุมดำและยืนยันทฤษฎีของ Hawking นำไปสู่ที่ไหน?
แผนที่แรกที่แม่นยำของโลกถูกสร้างขึ้น คนอื่นผิดอะไร