Вчительку-нейросеть «Ольгу Станіславівну» навчили російському сленгу та сарказму

Розробники з компанії LiveDune, що займається аналітикою соціальних мереж, створили нейромережу, здатну

оцінювати тональність коментарів у соціальних мережах. Програма, яку на честь вчительки директора компанії назвали «Ольга Станіславівна», працюватиме разом із філологами.

Штучний інтелект володіє відразу двомамовами: меншою мірою російською літературною та досконало сленгом російської мови, що сформувався у 2020–2022 роках. Для навчання нейронної мережі розробники використовували словники оціночних слів та матюків. Але основний акцент вони зробили не на літературні збірки, а на мову, якою розмовляють у соціальних мережах.

Для первинного навчання розробники вручнурозмітили 10 тис. російськомовних коментарів із соціальних мереж клієнтів компанії. Після цього сервіс запустили в роботу, але, як кажуть творці, відразу з'явилися скарги на некоректну роботу ІІ. Програма погано розпізнавала сарказм, а, наприклад, коментар: «це страшенно безпонтовий піст» — вважала позитивним.

Приклад сервісу. Зображення: LiveDune

Щоб донавчити систему, творці надаликлієнтам можливість коригувати оцінку «Ольги Станіславівни». Виправлені дані направляються в систему та застосовуються для доопрацювання алгоритмів. Фактично нейромережа використовувала на навчання понад 500 тис. записів.

Програмісти кажуть, що найскладніше булонавчити «Ольгу Станіславівну» визначати іронію та сарказм. Для цього в нейромережу додатково завантажили навчальні матеріали - словники жаргонізмів та мату. Ну і, звичайно, практика на реальних відгуках із зворотним зв'язком від користувачів ІІ.

«Ольга Станіславівна» має найактуальнішийсловниковим запасом сучасного російського сленгу — мови, якою спілкуються в соціальних мережах. Тільки у «ВКонтакті» через нейромережу «пройшло» близько 20 млн. коментарів. Розробники планують використовувати дані, накопичені системою для проведення разом з філологами дослідження російської мови.

Запозичення, скорочення тарозмовно-просторові елементи масово використовуються нами під час спілкування у мережі. Словники, які фіксують мовну норму, завжди відставали від живої мови, але поява такої нейромережі може допомогти філологам точніше відстежувати розвиток мови.

Марія Рогожина, філолог

Читати далі:

Незабаром на Землю обрушиться сонячна буря: матеріал летить зі швидкістю 800 км/с

Вчені зняли на відео дивну істоту зі щупальцями, яку прийняли за квітку

Росія залишає МКС: що тепер буде і чому обслуговування станції під загрозою