Bots kommer att tvingas vara artiga: en antitoxisk algoritm har utvecklats för dem

Исследователи из Калифорнийского университета в Сан-Диего разработали алгоритмы для очистки речи от

оскорбительных выражений, которую генерируют онлайн-боты.

Ранее эксперты пробовали разные подходы для очистки речи ботов, но они оказывались не эффективными. При составлении списка токсичных слов упускаются слова, которые при употреблении вне контекста и по отдельности кажутся нормальными, но становятся оскорбительными при использовании в сочетании с другими. Попытка удалить токсичную речь из обучающих данных отнимает много времени и далеко не надежна. Аналогичные проблемы возникают при разработке нейронной сети, которая выявляла бы токсичную речь.

Теперь специалисты по информатике из Калифорнийского университета в Сан-Диего попробовали новый метод. Сначала они запустили «вредные» подсказки в предварительно обученную языковую модель, чтобы заставить ее генерировать токсичный контент. Затем исследователи обучили модель, которую назвали «злой», прогнозировать вероятность того, что контент будет оскорбительным. После инженеры обучили «хорошую модель», которую научили избегать всего контента, высоко оцененного «злой моделью».

Som ett resultat bekräftade författarna till utvecklingen att derasden "bra modellen" visade sig vara effektivare än de modernaste metoderna. Forskarna presenterade sitt arbete på AAAI Online Conference on Artificiell Intelligens.

Läs mer:

Den har jagats i århundraden: vad vet vi om planeten Vulcan bredvid solen

Fysiker har experimentellt bekräftat en ny grundläggande lag för vätskor

Astronomer har hittat källan till mystiska radioskurar som kommer från rymden

Geek Tech Online

Allt om teknik och prylar

Bots kommer att tvingas vara artiga: en antitoxisk algoritm har utvecklats för dem