Boti budú nútení byť zdvorilí: bol pre nich vyvinutý antitoxický algoritmus

Vedci z Kalifornskej univerzity v San Diegu vyvinuli algoritmy na čistenie reči

urážlivý jazyk generovaný online robotmi.

Odborníci už predtým skúšali rôzne prístupyčistenie reči robotov, ale ukázali sa ako neúčinné. Uvádzanie toxických slov vynecháva slová, ktoré, keď sa použijú mimo kontextu a samostatne, sa zdajú normálne, ale v kombinácii s inými sa stanú urážlivými. Pokúšať sa odstrániť toxickú reč z trénovacích údajov je časovo náročné a ani zďaleka nie spoľahlivé. Podobné problémy vznikajú pri vývoji neurónovej siete, ktorá by detekovala toxickú reč.

Teraz špecialisti na informatikuz Kalifornskej univerzity v San Diegu vyskúšali novú metódu. Najprv vložili „škodlivé“ podnety do vopred trénovaného jazykového modelu, aby ho prinútili generovať toxický obsah. Výskumníci potom vycvičili model, ktorý nazvali „zlý“, aby predpovedali pravdepodobnosť, že obsah bude urážlivý. Inžinieri potom vycvičili „dobrý model“, ktorý sa naučil vyhýbať sa všetkému obsahu, ktorý bol vysoko hodnotený „zlým modelom“.

V dôsledku toho autori vývoja potvrdili, že ich„dobrý model“ sa ukázal byť účinnejší ako najmodernejšie metódy. Výskumníci prezentovali svoju prácu na online konferencii AAAI o umelej inteligencii.

Čítaj viac:

Po stáročia sa loví: čo vieme o planéte Vulcan vedľa Slnka

Fyzici experimentálne potvrdili nový základný zákon pre kvapaliny

Astronómovia našli zdroj záhadných rádiových výbuchov, ktoré prichádzajú z vesmíru