Boti būs spiesti būt pieklājīgi: tiem ir izstrādāts prettoksiskais algoritms

Pētnieki Kalifornijas Universitātē Sandjego ir izstrādājuši algoritmus runas tīrīšanai

aizskaroša valoda, ko ģenerē tiešsaistes robotprogrammatūra.

Eksperti jau iepriekš ir izmēģinājuši dažādas pieejastīrīt runu no robotprogrammatūras, taču tie izrādījās neefektīvi. Uzskaitot toksiskus vārdus, tiek atstāti vārdi, kas, lietojot ārpus konteksta un atsevišķi, šķiet normāli, bet kļūst aizvainojoši, ja tos lieto kopā ar citiem. Mēģinājums noņemt toksisko runu no apmācības datiem ir laikietilpīgs un ne tuvu nav uzticams. Līdzīgas problēmas rodas, izstrādājot neironu tīklu, kas varētu noteikt toksisku runu.

Tagad datorzinātņu speciālistino Kalifornijas universitātes Sandjego izmēģināja jaunu metodi. Pirmkārt, viņi ievadīja “kaitīgas” norādes iepriekš sagatavotā valodas modelī, lai piespiestu to radīt toksisku saturu. Pēc tam pētnieki apmācīja modeli, ko viņi sauca par "ļaunumu", lai prognozētu iespējamību, ka saturs būs aizskarošs. Pēc tam inženieri apmācīja “labo modeli”, kuram tika mācīts izvairīties no visa satura, ko augstu novērtēja “ļaunais modelis”.

Rezultātā izstrādes autori apstiprināja, ka viņu"labais modelis" izrādījās efektīvāks par vismodernākajām metodēm. Pētnieki iepazīstināja ar savu darbu AAAI tiešsaistes konferencē par mākslīgo intelektu.

Lasīt vairāk:

Tas ir medīts gadsimtiem ilgi: ko mēs zinām par planētu Vulkāns blakus Saulei

Fiziķi ir eksperimentāli apstiprinājuši jaunu šķidrumu pamatlikumu

Astronomi ir atraduši noslēpumainu radio uzliesmojumu avotu, kas nāk no kosmosa