Los bots se verán obligados a ser educados: se ha desarrollado un algoritmo antitóxico para ellos

Investigadores de la Universidad de California en San Diego han desarrollado algoritmos para limpiar el habla de

Lenguaje ofensivo generado por bots en línea.

Los expertos han probado previamente diferentes enfoques paralimpiando el discurso de los bots, pero resultaron ineficaces. La lista de palabras tóxicas omite palabras que, cuando se usan fuera de contexto y solas, parecen normales, pero se vuelven ofensivas cuando se usan en combinación con otras. Intentar eliminar el discurso tóxico de los datos de entrenamiento requiere mucho tiempo y está lejos de ser confiable. Surgen problemas similares al desarrollar una red neuronal que detecte el habla tóxica.

Ahora especialistas en informática.de la Universidad de California en San Diego probó un nuevo método. En primer lugar, introdujeron señales "dañinas" en un modelo de lenguaje previamente entrenado para obligarlo a generar contenido tóxico. Luego, los investigadores entrenaron un modelo que llamaron "malvado" para predecir la probabilidad de que el contenido fuera ofensivo. Luego, los ingenieros entrenaron al "modelo bueno", al que se le enseñó a evitar todo el contenido altamente calificado por el "modelo malo".

Como resultado, los autores del desarrollo confirmaron que suel "buen modelo" demostró ser más efectivo que los métodos más modernos. Los investigadores presentaron su trabajo en la Conferencia en línea AAAI sobre inteligencia artificial.

Lee mas:

Ha sido cazado durante siglos: qué sabemos del planeta Vulcano junto al Sol

Los físicos han confirmado experimentalmente una nueva ley fundamental para los líquidos

Los astrónomos han encontrado la fuente de misteriosas ráfagas de radio que provienen del espacio