5 трендів робототехніки: нейромережі, розпізнавання мови і емоцій, навігація і системи безпеки

нейромережеві технології

Кожен день виходять новини про нові застосуваннях нейронних мереж. У США створюється

нейросеть, анімуйте 2D-зображення: вона обробляє дані про об'єкт, відокремлює його від фону та інших об'єктів, а потім створює 3D-модель і механізм її руху, заповнює фон, який раніше був закритий об'єктом. В Ізраїлі нейросеть визначає інтелект за формою черепа - система аналізує риси обличчя людини і на їх основі визначає, які особливості закладені в його ДНК. У Росії створюють нейросеть, здатну торгувати криптовалюта - аналізувати ринок і робити прогнози.

Штучна нейронна мережа (ІНС) - математична модель (а також її програмнеабо апаратне втілення), побудована за принципом організації та функціонування біологічних нейронних мереж - нервових клітин живого організму. Це поняття виникло при вивченні процесів, що протікають в мозку, і при спробі змоделювати ці процеси.

Сфер застосування цієї технології досить багато. Наприклад, нейросеть повинна відрізняти собак і кішок. Для настройки алгоритму дається великий масив підписаних зображень кішок і собак. Нейросеть аналізує ознаки об'єктів на цих картинках і будує розпізнавальну модель, яка мінімізує відсоток помилок щодо еталонних результатів.

До речі, коли Google просить вас підтвердити, щови не робот, і відзначити світлофори або автобуси, ви проходите не елементарні тест на когнітивні здібності, а навчаєте нейросеть розрізняти об'єкти дорожньої інфраструктури. Система буде використовуватися в безпілотники.

Застосування нейронних мереж нічим не обмежена,однак своє найбільш широке застосування в робототехніці нейромережі знайшли в голосових помічників і взаємодії з людьми. Нейросети забезпечують точність відповіді на питання. Якість голосового помічника залежить саме від них. Серед голосових помічників можна виділити Alexa від Amazon, Cortana від Microsoft і Siri від Apple. Серед російських голосових помічників - «Аліса» від Яндекса.

Чим якісніше навчена нейромережа, тимкраще вона підбирає відповіді на запити співрозмовника: розуміє зворотний порядок слів, контекст і непрямий запит. Саме цей напрямок стане одним з найперспективніших в розробках майбутнього. Оскільки інтернет змінює соціальні процеси, швидкість передачі інформації і взагалі темп життя колосально зросли. Але людина стає все більш самотнім. Чи стане актуальним робот-компаньйон, який буде задовольняти потребу в спілкуванні, розумінні, підтримці.

В Японії вже з'являються цифрові компаньйони,функціонал яких виходить за рамки простих консультантів. Вони стають помічниками, друзями і навіть дружинами. Захід теж не відстає: 47 млн ​​жителів США (а це майже 20% всього дорослого населення) користуються розумними колонками, Amazon Echo або Google Alexa. Причому, виходячи з останніх досліджень, користуються розумними колонками, не тільки щоб давати їм команди. 25% беруть їх з собою спати, 20% жартують з ними, 15% використовують як няню для дітей - колонка розповідає казки і допомагає відвернути дитини.

Уміння підтримувати діалог стане одним з ключових вимог до роботів і одним з перспективних і затребуваних напрямів розробки.

Система розпізнавання мови

Одна справа просто підібрати відповідь на запит, алеправильно почути і розшифрувати запит співрозмовника набагато важче. На точність впливають всі елементи системи розпізнавання мови: навчальна вибірка і самі алгоритми розпізнавання.

Впливає якість аудиопотока - відношеннясигнал / шум, розбірливість мови і гучність. Сучасні системи намагаються доповнювати «нерасслишанное» за рахунок лінгвістичних моделей - в кожній мові є свої усталені вирази та стійкі зв'язки слів.

Тобто коли говорять, що для розпізнаваннявикористовується контекст, то розуміється наявність підстроювання під розпізнавання за рахунок додаткових даних, наприклад, конкретні фрази використання, як в розумних колонках, або використання певного словника для конкретної предметної області.

Точність або якість розпізнавання вважається яквідношення правильно розпізнаних слів до кількості всіх вимовлених слів, також додається метрика помилкових распознаваний як відношення помилково розпізнаних слів до всіх розпізнаних словами.

Компанія LG представила в 2018 році свогодомашнього помічника. На сцені Девід Вандервол, старший директор з маркетингу, намагався продемонструвати Cloi - нового домашнього помічника від LG. За розміром трохи більше крапельної кавоварки, Cloi повинна знаходитися на столі, у неї немає рук і коліс, її голова обертається і киває під час розмови. Це голосовий помічник, призначений допомагати в організації вашого життя.

На сцені Вандервол питав у Cloi, колизакінчиться прання - відносно простий запит повинен був точно продемонструвати, якого саме помічника LG має намір продавати. У відповідь Cloi приголомшливо замовкла.

«Навіть у роботів бувають важкі дні, - намагавсявідбутися жартами Вандервол. - Так, якщо нам відомо, коли закінчиться прання, то можна синхронізувати роботу пральної машини з сушаркою і згадати, що у нас в холодильнику курка, термін придатності якої спливає через три дні. Схоже, ми повинні її приготувати. Cloi, включайся в бесіду: що я можу приготувати з курки ».

Але навіть на цю фразу Cloi нічого не відповіла.

Невідомо, що стало причиною провалу: великий простір з акустикою, якість інтернет-з'єднання або ж недоробки в ПО. Так чи інакше, робот-провідник між людиною і технікою просто не працював.

Флагманом індустрії вважається Google - вже багатороків він займається розробками в цій галузі, досягнувши найбільшої точності і стабільності розпізнавання. Влітку він представив оновлений голосовий помічник - і стверджує, що точність розпізнавання (англійської мови) порівнянна з людською. Щоб обробити запит і видати релевантний відповідь, системі Google потрібно не більше секунди.

«Промобот»

Однак для використання системи розпізнавання відGoogle необхідно купувати ліцензії, і це досить дорого. До того ж, пристрій з розпізнаванням мови може використовуватися в самих різних умовах. Параметри розпізнавання для домашнього помічника і робота в місцях підвищеного скупчення людей різні. І цю специфіку намагаються враховувати розробники «Промобота» - вони розробляють систему мікрофонних масивів і офлайн розпізнавання. Це дозволить роботам менше залежати від якості інтернет-з'єднання і залишатися хорошим співрозмовником як при нестабільному з'єднанні, так і в шумних приміщеннях.

Технологія розпізнавання осіб і емоцій

Для того, щоб організувати якісневзаємодія між людиною і роботом, необхідно розуміти, хто знаходиться перед машиною і які емоції відчуває людина. Такі дані дозволять йому вибирати найбільш ефективну комунікаційну стратегію, робити релевантні пропозиції. Наприклад, запропонувати знижку на улюблений сорт морозива, щоб ви не сумували, або повідомити про акцію в відділі косметики, якщо робот бачить перед собою дівчину.

Російська компанія VisionLabs пропонуєрізні галузі застосування даної технології. Платформа розпізнавання осіб LUNA дозволить власнику відкривати машину без ключа і оплачувати покупки за допомогою Селфі. Розпізнавання осіб від VisionLabs впроваджено в пропускну систему школи Ощадбанку, використовується для верифікації студента при здачі іспитів в Московському інституті психоаналізу.

Якщо говорити про розпізнавання емоцій, то вонозатребуване індустріями, де передбачається обслуговування. Наприклад, «Альфа-банк» тестує систему розпізнавання емоцій клієнта. Алгоритм аналізує вираз обличчя відвідувача, після обслуговування виставляє оцінку. Так банк отримує зворотний зв'язок, не вдаючись до опитувань та інтерв'ю.

«Промобот» і Neurodata Lab запустили пілотнийпроект робота-емпатії, здатного розпізнавати до 20 емоційних станів людини. Відповідно до розпізнаної емоцією робот буде вибудовувати спілкування - підбадьорювати або заспокоювати співрозмовника, почне жартувати і грубити, якщо помітить позитивну реакцію. Поки проект знаходиться на стадії тестування, однак робот вже був представлений на CES-2019.

система навігації

Залежно від завдань, існують outdoor- іindoor-технології. Outdoor-навігація потрібна для безпілотних автомобілів і літальних апаратів, indoor-навігація - для охоронних і сервісних роботів в будівлях.

Сьогодні існують два типи навігації: глобальні та локальні. Глобальні припускають навігацію по супутникових систем, вони затребувані в системах outdoor, але непридатні для indoor. Не завжди є зв'язок і низька точність відображення положення. Локальні включають в себе навігацію за допомогою ультразвукових, оптичних і інфрачервоних систем. Існуючі системи - дорогі, тому головним викликом на 2019 рік стане їх здешевлення.

Наприклад, система датчиків для автомобіля Teslaкоштувала кілька сотень тисяч доларів. Але внаслідок великого поширення автомобілів з автопілотом вартість лидара зменшилася через перехід з нішевого і дорогого товару в область широко поширеного. А також з появою доступних і дешевих СВЧ-рішень в робототехніці починають застосовувати радари міліметрового діапазону, що раніше було доступно тільки як дорога опція преміум-автомобілів.

Наприклад, стартап Marvelmind створив високоточнусистему indoor-навігації вартістю $ 349. Однак для його роботи потрібно від чотирьох стаціонарних маяків і один мобільний маяк, що ускладнює його застосування на великих площах і поза приміщеннями.

Навігаційні пристрої від Marvelmind

Якщо говорити про роботів в звичному розумінні, тодля того, щоб робот «Промобот» пересувався самостійно, без зіткнень, розробники використовують майже всі типи вимірювань: ультразвук, інфрачервоні датчики ближньої дії, лідари. Це забезпечує максимальний рівень безпеки пересування робота.

Інформаційна безпека

Забезпечення безпеки - найголовніший напрям робототехніки. Після спаду ейфорії щодо роботів люди почали замислюватися про безпеку себе і своїх даних.

Тренди загроз інформаційній безпеці в сферіробототехніки, в цілому, не сильно відступають від загальних в інформаційному середовищі. Розвиток інтернету речей вплинуло на активне поширення ботнет-мереж, що, на жаль, також актуально і для переважної більшості роботизованих пристроїв.

Виробники часто нехтують серйозним захистом від кіберзагроз або ж взагалі їй нехтують, що призводить до використання роботів з метою шпигунства, фішингу або крадіжки даних.

Нещодавно дослідники Positive Technologiesпомітили, що роботи-пилососи підслуховують своїх господарів і передають цю інформацію через інтернет - і навіть можуть Майні криптовалюта. Використовуючи уразливості в системі безпеки, зловмисник може перехопити конфіденційні дані через мережевий трафік: це не тільки ваші фото, але навіть дані банківського рахунку.

На початку року був опублікований звіт провразливості робота Pepper. Експертам вдалося передати на пристрій сторонні файли без аутентифікації і навіть увійти в обліковий запис суперкористувача. Також вони змогли здійснити перехоплення платіжної інформації, даних з відеокамер і мікрофонів.

З точки зору серйозності наслідків, сьогодніпитання найбільш гостро стоїть в сфері промислової робототехніки. На кінець 2018 року кількість атак на інформаційні мережі російських АСУ ТП вище, ніж на банки або приватних осіб, а резонансні ситуації з вірусами-шифрувальники служать підтвердженням, що навіть АЕС може стати жертвою кібератаки.

Одним з варіантів розв'язання проблеми може стати використання ІІ для менеджменту безпеки, що вже сьогодні поступово реалізується провідними виробниками антивірусних систем.

Разом з тим в найближчі кілька років кількістьроботів, з якими нам доводиться стикатися щодня, істотно зросте. Від цього критерію залежить безпека людини - ключовий напрямок, світова робототехніка зверне увагу на цю сферу як можна раніше.

Кількість автоматизованих процесів зростає, азначить і все більше роботів проникає в нашу повсякденність. Вимоги до якості роботи роботів зростають, оскільки вони виходять на рівень інфраструктурної одиниці, а не дива і примхи. З розвитком найбільш затребуваних галузей робототехніки необхідно підвищити якість роботи голосових асистентів, що включають розпізнавання мови, якість обробки запитів і відповідь на них. Для поширення безпілотників і сервісних роботів потрібно здешевлення систем навігації. Головним чином, для забезпечення безпеки людини і його даних при взаємодії з роботами необхідно виключити всі уразливості в системі безпеки. Це і є головні виклики на 2019 рік.