Аніма Анандкумар, NVIDIA - про технології навчання ІІ, його адаптивності і проблеми

Аніма Анандкумар— професор у Каліфорнійському технологічному інституті та директор з досліджень у

галузі машинного навчання в NVIDIA.Раніше була головним науковцем Amazon Web Services. Здобула кілька нагород, серед яких — стипендія імені Альфреда П. Слоана, премія за кар'єру NSF, нагороди молодих дослідників від Міністерства оборони та стипендії викладачів від Microsoft, Google та Adobe. Є членом експертної ради Всесвітнього економічного форуму. Захоплена розробкою алгоритмів ІІ та їх застосуванням у міждисциплінарних додатках. Її дослідження зосереджені на неконтрольованому штучному інтелекті, оптимізації та тензорних методах.

«Ситуація з коронавірусів показує, що люди набагато випереджають ІІ»

Як розпочалася революція штучного інтелекту?Уже несколько десятилетий появляются интересные відкриття в цій галузі. Для людини немає нічого буденніше, ніж розпізнавати зображення на екрані. Але для ІІ це вкрай важка задача, тому що він не народжується з уже заданими здібностями до цього. Перед ученими стояло завдання "навчити" машинний мозок ідентифікувати побачене. На самому початку досліджень один з професорів Стенфорда почав підписувати зображення, щоб комп'ютера було легше їх класифікувати. Саме марковані картинки стали початком революції глибинного нейронного навчання.

Вихід на новий рівень розробки ІІ розпочався із закладання у програму мільярдів параметрів, які дозволять йому дізнатися конкретний об'єкт.Складність завдання в тому, щоб глибинна нейросетьв умовах інваріантності розпізнала, наприклад, собаку незалежно від відмінності поз, забарвлення, породи і так далі. Навчання штучного розуму означає, що під час процесингу зображення в ієрархічному порядку розглядається цілий ряд шарів кадру. Так, на базовому рівні видно лише лінії під різними кутами один до одного. Потім вони з'єднуються і складають більш складні форми, припустимо, морду собаки в кольорі. Помітні вже форма, колір і інші окремі характеристики. Саме етап, коли ми навчилися поділяти процес на частини, на рівні, став величезним кроком вперед.

Для подальшого розвитку потрібні не тільки глибинні нейронні мережі, а й величезні обчислювальні потужності.Протягом останніх десятиліть ми бачилиуповільнення зростання можливостей наших комп'ютерів, коли більше не збільшується вдвічі швидкість однопотокових обчислень. Але при цьому зараз ми можемо паралельно проводити розрахунок величезних за обсягом та складністю операцій. Сучасний рівень розвитку глибинних мереж призвів до того, що зараз можуть відбуватися мільярди процесів одночасно. І ціль їх лише одна: визначити, що ж зображено на фотографії. Ця процедура здійснюється за допомогою матриксних мультиплікаційних процесів та інших технологій. І тут, звісно, ​​все залежить від потужності відеокарт.

До 2014 року глибинні нейромережі змогли краще людей розпізнавати зображення, а значить, сьогодні вони стали ще більш досконалими.Це сталося завдяки об'єднанню трьохфакторів: можливостей маркованих даних, гнучкості існуючих алгоритмів глибинних нейромереж та величезних можливостей комп'ютерів. Є багато прекрасних прикладів того, які висоти вже брав машинний мозок, наприклад, глибинне навчання з підкріпленням допомогло ІІ перемогти людину в грі. Цей гравець був одним із найкращих, але він програв. Крім того, зараз штучний інтелект здатний генерувати фотографії людей настільки реалістичні, що ця технологія вже пройшла тест Т'юрінга. Людина вже не може зрозуміти, яке зображення є реальним, а яке було створено машиною. Це чудові приклади успіхів ІІ, але, напевно, на цьому прогрес не зупиниться.

Однак є цілий ряд прикладів, де ІІ не виправдав очікувань.Допустимо, ситуації, де ключовим аспектомє безпека. Вже кілька десятиліть ми бачимо посилення технологій, які використовуються в автономних автомобілях, але, на жаль, їхня недостатня досконалість все одно призводить до аварій. Також машина не може замінити людину в тому, що стосується створення контенту та його редагування. І нинішня ситуація з коронавірусом показує, що люди набагато випереджають ІІ.

Чим ми будемо займатися в майбутньому, розвиваючи штучний інтелект і технології глибинних нейромереж?На даний момент активно розвиваєтьсяробототехніка: наприклад, одна компанія має робот, який вміє робити сальто назад. Але його не можна навіть порівняти із собакою. Цей робот незграбний, постійно падає, але тварина, падаючи, вчиться, як наступного разу зробити той чи інший рух, не впавши. А робот на це не здатний, він не навчений. Тут постає питання, чи можливо зробити ІІ, який буде готовий самостійно навчатися та вирішувати проблеми?

«Розуміння алгоритмів знаходиться за межами наших можливостей»

Алгоритм штучного інтелекту - це сукупність заздалегідь закладеної інформації і дуже чіткого завдання.Ми визначаємо, які дані та попередньозадані параметри повинні використовуватись, а також як реалізувати процес прийняття рішень. Для створення та підтримки алгоритму ІІ потрібні величезні обсяги даних. Це складно, тому що даних стає все більше і більше, наприклад, при розпізнаванні відеопотоку кількість кадрів, що розпізнаються дуже велика. Проблематично проводити маркування, бо люди надають назви мільйонам відеороликів, а отже, і об'єктам на екрані.

Що стосується заздалегідь закладаються параметрів, то знову доводиться стикатися з тим, що все робиться вручну.Зараз легко обдурити ІІ.Наприклад, якщо ми маємо знак «Стоп» і ми помістимо на нього кілька блоків, то штучний інтелект уже не зрозуміє його значення. І автомобіль, що рухається без допомоги водія, вже не розпізнає цей знак як заклик зупинитись. Наш, людський інтелект зовсім інший. Можливо, ми зможемо перенести образ нашого мислення в комп'ютер, але поки що ми цього не змогли зробити. Щодо вказівок, наказів та інструкцій, то доводиться діяти дуже просто: ми даємо одне завдання — розпізнати, що зображено на цій картинці. А щодо параметрів оцінки успіху чи неефективності роботи алгоритму, то тут ми дуже обмежені.

Ми іноді не можемо зрозуміти, наскільки успішний діючий алгоритм, тому що це знаходиться за межами нашого розуміння.Крім того, є кілька проблем, пов'язаних зтим, що дані, які ми маємо, в основному стосуються чоловіків зі світлою шкірою. Тому ІІ неправильно визначає темношкірих жінок. Є й інші помилки у розпізнаванні осіб. Проблема виникає через те, що оцінка ефективності штучного інтелекту вкрай обмежена. Не треба забувати про парадигму, яка говорить, що нам потрібні величезні обсяги даних, і всі вони мають бути марковані. Заздалегідь закладені параметри мають бути зрозумілі алгоритму, а завдання має бути простим і логічним.

Спочатку потрібно домогтися відсутності необхідності маркувати дані.ІІ має працювати без допомоги людини, щобкомп'ютер сам знаходив концепти, формував ідеї, розумів особливості того чи іншого зображення. Чи це складно? Так, дуже, але люди це роблять, причому з легкістю. Що стосується даних, що заздалегідь закладаються, тут потрібно створювати дуже чіткі образи, показувати, що є що з тих даних, які ми «згодовуємо» системі. І тут можна багато чого навчитися у мозку людини. Ну і, зрештою, завдання, які ми даємо алгоритму. ІІ має бути більш адаптивним, тому що зараз ми щоразу з нуля навчаємо нашу систему, а потрібно зробити так, щоб вона могла адаптуватися та змінюватись, виконувати різні завдання. Отже, зараз ми тренуємося, щоб зробити штучний інтелект гнучким.

Як зрозуміти, що перед нами кішка?

Ми дізнаємося кішку, навіть якщо це розмита картинка, тому що наш мозок постійно намагається розмитому зображенню надати певну різкість для подальшого аналізу.Є багато теорій, і одна з найвідомішихкаже, що ми не тільки дивимося на якийсь об'єкт, а й одночасно мозок підбирає варіанти того, чим він може бути. Цим же займаються і глибинні нейронні мережі. У нас є апріорні дані про те, як повинна виглядати кішка. І ми намагаємося зіставляти цю картинку з уявленням про те, як виглядають коти. Це важливо розуміти при розробці, щоб було сталість ідентифікації зображень.

Як нам досягти стабільності в ідентифікації об'єктів штучними мережами?Природним чином це відбувається черезповторюваності. Ми беремо якусь зовнішню картинку і дивимося на неї, а сигнал надходить в мозок. Є також і спадна зворотний зв'язок. Використовуючи інформацію про те, як виглядає кішка, мозок формує певне сприйняття. Як зробити так, щоб ці складні процеси нашого мозку реалізовувалися ІІ? Необхідно поєднати хороший класифікатор для поняття «кішка», який будуть «згодовувати» нейронної мережі, з відмінним генератором цих зображень. Одночасно відбуватиметься класифікація поняття і навчання нейронної мережі. Буде отримана зворотний зв'язок для стандартних нейронних мереж. І цей зв'язок дасть можливість отримувати генеративную зворотний зв'язок. Іншими словами, при спробі обробити вхідний сигнал людина намагається маркувати зображення. І тоді виникає зворотний зв'язок, коли ми намагаємося згенерувати сприйняття на основі того, що бачимо. Ці два процеси повинні бути взаємопов'язані.

Стандартна нейросеть, як правило, не може розпізнати нечіткі картинки, але наша модель завдяки механізму зворотного зв'язку робить образи більш чіткими і потім зможе їх розпізнати.Ми бачимо, що така схема довела своюдієвість, тому можемо надихатися тим, як людина, при створенні комп'ютерного зору. На основі вже розроблених моделей можна створювати досконаліші алгоритми, які відрізнятимуться високою продуктивністю. Але також потрібна ефективна інфраструктура, яка оброблятиме процеси ІІ у великому масштабі. Ми працюємо з алгоритмами окремо. Ви берете якісь дані та їх потрібно візуалізувати, що є дуже складним процесом. Тому потрібен потужний процесор, здатний обробляти значні обсяги інформації. Крім того, ми використовуємо певні фреймворки (CLARA) для різних програм, у тому числі й для медицини. Зараз з урахуванням пандемії COVID-19 виникла потреба у тому, щоб тренувати моделі машинного навчання у великих масштабах. Метою цього є розробка вакцин та ліків від вірусу. Інструмент CLARA може працювати з об'ємними структурами та різними алгоритмами, будучи по суті координатором їхньої роботи.

Ще одна можливість навчання ІІ полягає у використанні не реальних, а стимульованих даних.У нас є низка роботів, які можуть статишеф-кухарями на наших кухнях. Такі машини здатні відкрити та закрити ящик, взяти якийсь предмет, щось змішати чи збити. Ці прості в людини операції дуже складні роботів, оскільки навчити їх цьому проблематично. Але за допомогою процесів моделювання ми зможемо відкривати неіснуючі запрограмовані ящики. І таким чином робот навчається подібним операціям. Програми дозволяють робити це паралельно та у великих масштабах, що дозволяє подолати обмеження, які накладають на нас дані. Але така система навчання означає, що потрібно розробити дуже складні алгоритми, які переведуть машину зі світу симуляції в реальний світ, відкриваючи нові, захоплюючі перспективи роботи з ІІ. Існує програма, яка дозволяє додавати симуляцію до тих моделей, коли штучний інтелект навчається на реальних даних. Це ще один приклад того, що ми маємо гарну інфраструктуру і ми можемо працювати з дуже складними проблемами. З'явилася можливість створювати нові алгоритми та моделі, а також тестувати їх набагато швидше, ніж це робилося раніше.

Майбутнє ІІ має бути всеосяжним і знаходити своє втілення в різних сферах, щоб у нас був високоадаптівний, постійно навчається інструмент.Для цього зараз потрібно переосмислити підходи доглибоке навчання. Самостійне навчання є ключем до успіху, тому потрібно знаходити способи вбудовувати програми неконтрольованого навчання у системи. І якщо говорити про згорткові нейромережі, система зворотного зв'язку робить їх більш стійким. А це перший крок до того, щоб створити реальну базу для ІІ нового покоління.

Читайте також:

Шукач скарбів знайшов скарб в Шотландії, якому 3000 років

Метеорний потік Персеїди - 2020: де його побачити, куди дивитися і як зробити фото

Подивіться на 3D-карту Всесвіту: її складали 20 років і вона вже здивувала вчених