Η εταιρεία δημιούργησε ένα σύνολο δεδομένων που ονομάζεται Project CodeNet, το οποίο περιέχει 14 εκατομμύρια δείγματα με συνολικό όγκο 500 εκατομμύρια
Οι συγγραφείς χρησιμοποίησαν κώδικα από δύο Ιάπωνεςδιαγωνισμοί προγραμματισμού: Aizu και AtCoder. Οι συμμετέχοντες έπρεπε να γράψουν τον κωδικό που χρειαζόταν για να μετατρέψουν ένα δεδομένο σύνολο εισόδων σε ένα σύνολο επιθυμητών εξόδων για 4.000 διαφορετικά προβλήματα. Το αποτέλεσμα ήταν 14 εκατομμύρια δείγματα κώδικα, τα μισά από τα οποία λειτουργούσαν.
Η IBM σχεδιάζει να κάνει το έργο ένα τυπικό σύνολο δεδομένων για την εκπαίδευση μοντέλων AI που μπορούν να αναγνωρίσουν τη δομή των προγραμμάτων.
Το CodeNet σχεδιάζεται να χρησιμοποιηθεί για τη δημιουργίαέξυπνα εργαλεία ανάπτυξης που αναζητούν τις απαραίτητες διαδικασίες σε εφαρμογές και βιβλιοθήκες, μεταφράζουν από τη μία γλώσσα προγραμματισμού στην άλλη, επιλέγουν τις σωστές εφαρμογές και φιλτράρουν τα λάθος, ταξινομούν τον κώδικα και ούτω καθεξής.
Διαβάστε περισσότερα
Οι πυρηνικές αντιδράσεις εντάθηκαν στον αντιδραστήρα του πυρηνικού σταθμού του Τσερνομπίλ
Οι επιστήμονες έχουν δείξει πώς μια μαύρη τρύπα διαλύει ένα αστέρι
Οι φυσικοί έχουν δημιουργήσει ένα ανάλογο μιας μαύρης τρύπας και επιβεβαίωσαν τη θεωρία του Hawking. Πού οδηγεί;