Bots serão forçados a ser educados: um algoritmo antitóxico foi desenvolvido para eles

Pesquisadores da Universidade da Califórnia, em San Diego, desenvolveram algoritmos para limpar a fala de

linguagem ofensiva gerada por bots online.

Os especialistas já tentaram diferentes abordagens paralimpando a fala dos bots, mas eles se mostraram ineficazes. Listar palavras tóxicas deixa de fora palavras que, quando usadas fora do contexto e sozinhas, parecem normais, mas tornam-se ofensivas quando usadas em combinação com outras. Tentar remover a fala tóxica dos dados de treinamento é demorado e está longe de ser confiável. Problemas semelhantes surgem ao desenvolver uma rede neural que detectaria fala tóxica.

Agora especialistas em ciência da computaçãoda Universidade da Califórnia em San Diego tentou um novo método. Primeiro, eles inseriram dicas "prejudiciais" em um modelo de linguagem pré-treinado para forçá-lo a gerar conteúdo tóxico. Os pesquisadores então treinaram um modelo que chamaram de “mal” para prever a probabilidade de o conteúdo ser ofensivo. Os engenheiros então treinaram o “modelo bom”, que foi ensinado a evitar todo conteúdo que fosse altamente avaliado pelo “modelo mau”.

Como resultado, os autores do desenvolvimento confirmaram que suao "bom modelo" mostrou-se mais eficaz que os métodos mais modernos. Os pesquisadores apresentaram seus trabalhos na Conferência AAAI Online sobre Inteligência Artificial.

Consulte Mais informação:

É caçado há séculos: o que sabemos sobre o planeta Vulcano ao lado do Sol

Físicos confirmaram experimentalmente uma nova lei fundamental para líquidos

Astrônomos descobriram a fonte de misteriosas rajadas de rádio que vêm do espaço