Ερευνητές στο Πανεπιστήμιο της Καλιφόρνια στο Σαν Ντιέγκο ανέπτυξαν αλγόριθμους για τον καθαρισμό της ομιλίας
Οι ειδικοί έχουν δοκιμάσει στο παρελθόν διαφορετικές προσεγγίσειςκαθαρίζοντας την ομιλία των bots, αλλά αποδείχθηκαν αναποτελεσματικά. Η λίστα τοξικών λέξεων αφήνει έξω λέξεις που, όταν χρησιμοποιούνται εκτός πλαισίου και μόνες τους, φαίνονται φυσιολογικές, αλλά γίνονται προσβλητικές όταν χρησιμοποιούνται σε συνδυασμό με άλλες. Η προσπάθεια αφαίρεσης της τοξικής ομιλίας από τα δεδομένα προπόνησης είναι χρονοβόρα και κάθε άλλο παρά αξιόπιστη. Παρόμοια προβλήματα προκύπτουν κατά την ανάπτυξη ενός νευρωνικού δικτύου που θα ανιχνεύει τοξική ομιλία.
Τώρα ειδικοί στην επιστήμη των υπολογιστώναπό το Πανεπιστήμιο της Καλιφόρνια στο Σαν Ντιέγκο δοκίμασε μια νέα μέθοδο. Πρώτον, τροφοδότησαν «επιβλαβείς» ενδείξεις σε ένα προεκπαιδευμένο γλωσσικό μοντέλο για να το αναγκάσουν να δημιουργήσει τοξικό περιεχόμενο. Στη συνέχεια, οι ερευνητές εκπαίδευσαν ένα μοντέλο που ονόμασαν «κακό» για να προβλέψουν την πιθανότητα ότι το περιεχόμενο θα ήταν προσβλητικό. Στη συνέχεια, οι μηχανικοί εκπαίδευσαν το «καλό μοντέλο», το οποίο διδάχθηκε να αποφεύγει όλο το περιεχόμενο που είχε υψηλή βαθμολογία από το «κακό μοντέλο».
Ως αποτέλεσμα, οι συντάκτες της ανάπτυξης επιβεβαίωσαν ότι τουςτο «καλό μοντέλο» αποδείχθηκε πιο αποτελεσματικό από τις πιο σύγχρονες μεθόδους. Οι ερευνητές παρουσίασαν την εργασία τους στο Διαδικτυακό Συνέδριο AAAI για την Τεχνητή Νοημοσύνη.
Διαβάστε περισσότερα:
Το κυνηγούν εδώ και αιώνες: τι γνωρίζουμε για τον πλανήτη Vulcan δίπλα στον Ήλιο
Οι φυσικοί επιβεβαίωσαν πειραματικά έναν νέο θεμελιώδη νόμο για τα υγρά
Οι αστρονόμοι βρήκαν την πηγή των μυστηριωδών ραδιοφωνικών εκρήξεων που προέρχονται από το διάστημα