Изследователи от Калифорнийския университет в Сан Диего са разработили алгоритми за почистване на речта
Експертите вече са опитвали различни подходи започистване на речта от ботове, но те се оказаха неефективни. Изброяването на токсични думи пропуска думи, които, когато се използват извън контекста и самостоятелно, изглеждат нормални, но стават обидни, когато се използват в комбинация с други. Опитът да се премахне токсичната реч от данните за обучение отнема време и далеч не е надежден. Подобни проблеми възникват при разработването на невронна мрежа, която да открива токсична реч.
Сега специалисти по компютърни наукиот Калифорнийския университет в Сан Диего опита нов метод. Първо, те подадоха „вредни“ сигнали в предварително обучен езиков модел, за да го принудят да генерира токсично съдържание. След това изследователите обучиха модел, който нарекоха „зъл“, за да предвидят вероятността съдържанието да бъде обидно. След това инженерите обучиха „добрия модел“, който беше научен да избягва цялото съдържание, което беше високо оценено от „злия модел“.
В резултат на това авторите на разработката потвърдиха, че техните"добрият модел" се оказа по-ефективен от най-модерните методи. Изследователите представиха работата си на онлайн конференцията AAAI за изкуствен интелект.
Прочетете още:
Той е ловуван от векове: какво знаем за планетата Вулкан до Слънцето
Физиците експериментално потвърдиха нов фундаментален закон за течностите
Астрономите откриха източника на мистериозни радиоизблици, идващи от космоса