Ботов змусять бути чемними: для них розробили антитоксичний алгоритм

Дослідники з Каліфорнійського університету в Сан-Дієго розробили алгоритми для очищення мови від

образливих виразів, що генерують онлайн-боти.

Раніше експерти пробували різні підходи дляочищення слова, але вони виявлялися не ефективними. При складанні списку токсичних слів упускаються слова, які при вживанні поза контекстом і окремо здаються нормальними, але ображаються при використанні в поєднанні з іншими. Спроба видалити токсичну мову з навчальних даних забирає багато часу і не надійна. Аналогічні проблеми виникають при розробці нейронної мережі, яка виявляла б токсичну мову.

Тепер фахівці з інформатикиз Каліфорнійського університету в Сан-Дієго спробували новий метод. Спочатку вони запустили «шкідливі» підказки в попередньо навчену мовну модель, щоб змусити її генерувати токсичний контент. Потім дослідники навчили модель, яку назвали "злою", прогнозувати ймовірність того, що контент буде образливим. Після цього інженери навчили «хорошу модель», яку навчили уникати всього контенту, високо оціненого «злою моделлю».

У результаті автори розробки підтвердили, що їх«хороша модель» виявилася ефективнішою, ніж найсучасніші методи. Дослідники представили свою роботу на онлайн-конференції AAAI зі штучного інтелекту.

Читати далі:

За нею полювали століттями: що нам відомо про планету Вулкан поруч із Сонцем

Фізики експериментально підтвердили новий фундаментальний закон для рідин

Астрономи знайшли джерело загадкових радіосплесків, що йдуть з космосу

Geek Tech онлайн

Everything about technology and gadgets

Ботов змусять бути чемними: їм розробили антитоксичний алгоритм